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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ;还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美国 等 发 达 国 家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真 正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华 章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 
就 将 工作 重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、 
McGraw-Hill、Elsevier、MIT 、John Wiley & Sons、Cengage 等 世界 著名 出 版 公司 建立 了 良 
好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum 、Bjarne Stroustrup、 
Brian W. Kernighan、Dennis Ritchie、Jim Gray、Afred V. Aho 、John E. Hopcroft、 Jeffrey 
D. Ullman、Abraham Silberschatz、 William Stallings、 Donald E. Knuth、 John L. Hennessy、 
Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 从 书 ” 为 总 称 出 版 ， 供 读者 
学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 
中 肯 的 选 题 指导 ， 还 不 杖 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 
500 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 
深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 善 尽 
美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 对 我 们 
的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 

华章 网 站 : www.hzbook.com 
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信息 革命 带 来 了 科技 的 突飞猛进 ， 使 我 们 前 所 未 有 地 感受 到 了 技术 的 力量 。 究 其 本 源 ， 
当前 的 各 种 便利 无 不 依赖 于 电子 计算 体系 所 支撑 的 强大 算 力 。 编 程 也 好 ， 算 法 也 罢 ， 无 外 乎 
对 于 算 力 的 驾驭 问题 。 

细 说 起 来 ， 编 程 又 分 为 编程 语言 和 编程 思想 。 如 果 把 编程 语言 比 作 武功 招式 ， 那 么 编程 
思想 就 是 内 力 。 按 照 传统 计算 机 知识 体系 ， 以 熟悉 一 门 编程 语言 作为 起 手 式 和 基本 功 ， 继 而 
开始 学 习 数 据 结构 、 各 种 算法 设计 、 计 算 机 组 成 原理 、 编 译 原理 等 知识 模块 ， 再 深入 研究 可 
计算 性 原理 、 形 式 语 言 与 自动 机 等 内 容 。 如 此 从 运用 人 和 手 继而 归 漳 计算 机 构造 方法 乃至 思想 
的 路 径 ， 虽 然 有 助 于 循序 渐进 地 了 解 和 掌握 程序 的 运行 规律 、 编 程 语言 的 设计 思想 ， 以 便 深 
入 理解 如 何 写 出 优秀 的 代码 。 但 是 ,， 这 一 路 径 的 每 个 知识 模块 背后 都 是 数 部 艰深 的 巨著 ， 对 
于 那些 希望 短 时 间 内 能 够 掌握 程序 设计 思想 和 语言 运用 的 学 习 者 来 说 ， 这 趟 计算 机 寻 源 之 旅 
显得 有 些 漫长 。 

而 本 书 恰 为 上 述 读者 提供 了 一 条 “捷径 > ， 作 者 是 来 自 普林斯顿 大 学 的 两 位 大 师 Robert 
Sedgewick 和 Kevin Wayne， 书 中 巧妙 地 区 分 了 “程序 设计 思想 ”与 “编程 语言 使 用 ”之 间 
的 微妙 关系 ， 通 过 对 Java 语言 的 学 习 ， 讲 述 了 通过 程序 解决 问题 的 重要 思路 ， 而 没有 拘泥 
于 Java 的 语法 和 语言 特性 。 更 为 精彩 的 是 ， 本 书 在 后 半 部 分 构建 了 一 人 台 “ 玩 具 型 ”计算 机 ， 
并 分 析 了 它 如 何 执 行 前 半 部 分 写 出 的 程序 。 最 终 把 我 们 熟知 的 各 类 知识 和 应 用 场景 ， 与 计算 
机 深层 的 工作 原理 和 设计 方法 结合 在 了 一 起 。 本 书 已 经 被 普林斯顿 大 学 等 多 所 国际 知名 大 学 
广泛 采用 ， 堪 称 好 评 如 潮 。 此 次 我 们 配合 机 械 工 业 出 版 社 引进 、 翻 译本 书 ， 就 是 希望 能 够 为 
想 要 攀登 计算 机 这 座 新 世纪 高 峰 的 读者 提供 一 条 新 的 便捷 之 道 。 

本 书 能 够 顺利 成 稿 ， 要 囊 心 感谢 南开 大 学 嵌入 式 系统 与 信息 安全 实验 室 的 孙 承 君 、 刘 希 
明 、 刘 振 、 尹 腾 召 、 赵 洋 、 闫 美 君 、 权 玮 虹 、 曹 丁 元 、 李 浩然 等 同学 在 全 书 翻译 过 程 中 付出 
的 辛苦 努力 ; 感谢 南开 大 学 计算 机 学 院 与 网 络 空间 安全 学 院 的 各 位 老师 在 本 书 翻译 过 程 中 提 
供 的 指导 和 支持 ;要 感谢 机 械 工 业 出 版 社 的 各 位 同仁 的 易 力 协助 。 本 书 的 若干 个 相似 版 本 均 
有 前 辈 或 同仁 进行 了 翻译 ， 阅 读 这 些 译 著 的 过 程 令 我 们 受益 菲 浅 ， 特 此 表示 感谢 。 限 于 译 者 
水 平和 经 验 ,， 译 文中 难免 存在 不 当 之 处 ， 奶 请 读者 提出 宝贵 意见 。 

最 后 ,还 要 感谢 币 币 和 点 点 两 位 小 朋友 ， 要 不 是 你 们 ， 生 活 不 会 如 此 快乐 ; 要 不 是 你 
们 ,这 本 书 估计 早 就 翻译 完了 吧 ! 


译 者 于 马蹄 湖畔 
2019 年 9 月 
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20 世纪 的 教育 基础 是 “阅读 、 写 作 和 算术 ”， 现 在 则 是 “阅读 、 写 作 和 计算 ”。 学 习 编 
程 是 科学 和 工程 领域 教育 的 重要 组 成 部 分 。 除 了 直接 应 用 外 ， 这 是 理解 计算 机 科学 的 第 一 
步 ， 进 而 能 够 理解 为 什么 计算 机 会 对 现代 世界 产生 如 此 巨大 的 影响 。 本 书 的 目的 是 在 科学 的 
应 用 环境 中 讲解 编程 的 相关 知识 。 

我 们 的 主要 目标 是 通过 提供 有 效 使 用 计算 所 需 的 经 验 和 基本 工具 来 增强 学 生 的 能 力 。 我 
们 的 方法 是 教会 学 生 按照 一 种 自然 的 、 令 人 满意 的 、 创 造 性 的 方式 编写 程序 。 我 们 逐步 引入 
基本 概念 ， 并 引入 应 用 数学 和 科学 领域 的 经 典 应 用 来 说 明 概 念 ， 同 时 为 学 生 提 供 编写 程序 来 
解决 问题 的 机 会 。 我 们 也 设法 帮助 学 生 揭 开 计算 的 神秘 面纱 ,使 他 们 建立 对 计算 机 科学 领域 
的 重要 知识 的 基本 认识 。 

本 书 中 的 所 有 程序 都 使 用 Java 编程 语言 编写 。 本 书 的 第 一 部 分 教授 解决 计算 问题 的 基 
本 技能 ， 所 使 用 的 编程 方法 适用 于 许多 现代 计算 环境 ， 这 是 一 个 完整 的 解决 方案 ， 即 使 没有 
编程 经 验 的 人 也 能 够 学 会 。 这 里 我 们 强调 的 是 关于 编程 的 基本 概念 ， 而 不 是 Java 本 身 。 本 
书 的 第 二 部 分 更 多 地 偏重 计算 机 科学 的 知识 而 不 再 是 编程 ， 但 是 我 们 仍然 经 常 使 用 Java 程 
序 来 交流 主要 想法 。 

本 书 是 按照 跨 学 科 的 方法 对 传统 CS1 (computer science) 课程 进行 扩充 ,我们 强调 计算 
在 其 他 学 科 中 的 作用 ， 从 材料 科学 到 基因 组 学 、 天 体 物理 学 和 网 络 系统 。 这 种 方法 会 强化 学 
生 对 于 “数学 、 科 学 、 工 程 和 计算 在 现代 世界 中 交织 在 一 起 ”的 基本 认识 。 虽 然 本 书 是 为 一 
年 级 大 学 生 设计 的 CS1 教科 书 ， 但 也 可 用 于 自学 。 

范围 “本 书 的 第 一 部 分 围绕 学 习 编 程 的 三 个 阶段 进行 组 织 : 基本 元 素 、 函 数 、 面 向 对 象 
编程 。 我 们 提供 了 读者 在 进入 下 一 个 层次 之 前 需要 熟练 掌握 的 基本 内 容 。 我 们 的 方法 的 一 个 
基本 特征 是 使 用 示例 程序 来 解决 有 趣 问 题 ， 并 辅 以 练习 ， 包 括 从 自学 练习 到 需要 创造 性 解决 
方案 的 挑战 性 问题 。 

基本 元 素 包 括 变 量 、 赋 值 语句 、 内 置 数 据 类 型 、 控 制 流 、 数 组 和 输入 /输出 (包括 图 形 
和 声音 等 )。 

函数 是 学 生 首 次 接触 模块 化 编程 的 内 容 。 我 们 假设 学 生 已 经 熟悉 数学 函数 ， 在 此 基础 上 
引入 Java 函数 ， 然 后 考虑 函数 编程 的 意义 ,包括 函数 库 和 递归 。 我 们 强调 编程 时 要 将 程序 
划分 为 可 独立 调试 、 可 维护 和 可 复 用 的 组 件 ， 这 是 编程 的 基本 思路 。 

面向 对 象 编程 是 关于 对 数据 抽象 的 介绍 。 我 们 强调 数据 类 型 的 概念 及 其 使 用 Java 类 机 
制 的 实现 。 我 们 教授 学 生 如 何 使 用 、 创 建 和 设计 数据 类 型 。 模 块 化 、 封 装 和 其 他 现代 编程 范 
例 是 这 个 阶段 的 中 心 概念 。 

本 书 的 第 二 部 分 介绍 计算 机 科学 的 高 级 主题 : 算法 和 数据 结构 、 计 算 理论 和 计算 机 体系 
结构 。 : 

算法 和 数据 结构 将 现代 编程 范例 与 组 织 和 处 理 数据 的 经 典 方法 相 结 合 ， 这 些 经 典 方法 在 
现代 应 用 中 仍然 有 效 。 我 们 介绍 了 用 于 排序 和 搜索 的 经 典 算法 、 基 本 数据 结构 及 其 应 用 ， 并 
且 强 调 了 如 何 使 用 科学 方法 来 理解 某 段 代码 的 性 能 特征 。 
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计算 理论 使 用 简单 的 计算 机 抽象 模型 ， 帮 助 我 们 解决 计算 的 基本 问题 。 这 些 知 识 不 仅 具 
有 重要 的 理论 意义 ， 而 且 许 多 想法 在 实际 的 计算 应 用 中 也 是 非常 相关 甚至 可 以 直接 应 用 的 。 

计算 机 体系 结构 提供 了 一 个 理解 真实 世界 中 实际 计算 的 途径 一 一 在 计算 理论 的 抽象 计算 
设备 和 我 们 使 用 的 真实 计算 机 之 间 建 立 了 联系 。 而 且 ， 体 系 结构 的 研究 还 提供 了 与 过 去 的 联 
系 ， 因 为 当今 计算 机 和 移动 设备 中 的 微 处 理 器 与 20 世纪 中 叶 开 发 的 第 一 台 计 算 机 中 的 没有 
太 大 区 别 。 

本 书 的 关键 特征 之 一 是 注重 编程 在 科学 和 工程 中 的 应 用 。 我 们 通过 分 析 编 程 对 特定 应 用 
领域 产生 的 巨大 影响 来 引导 和 激发 学 生 学 习 每 个 相应 的 编程 概念 ， 以 应 用 数学 、 物 理 和 生物 
科学 以 及 计算 机 科学 本 身 为 例 ， 涉 及 的 问题 包括 物理 系统 模拟 、 数 值 方法 、 数 据 可 视 化 、 声 
音 合 成 、 图 像 处 理 、 财 务 模拟 和 信息 技术 等 。 具 体 的 例子 包括 第 1 章 中 基于 马尔 可 夫 链 的 网 
页 排名 处 理 ， 以 及 后 续 章 节 用 于 解决 渗透 问题 、 多 体 模 拟 和 小 世界 现象 的 案例 分 析 。 这 些 应 
用 程序 是 本 书 的 重要 组 成 部 分 。 它 们 能 够 引导 学 生 学 习 相关 主题 ， 说 明 编 程 概念 的 重要 性 ， 
并 为 计算 在 现代 科学 与 工程 领域 所 发 挥 的 重要 作用 提供 有 说 服 力 的 证 据 。 

在 后 面 的 章节 中 强调 了 编程 发 展 的 历史 知识 ， 也 着 重 介绍 了 艾 伦 . 图 录 、 冯 … 诺 依 曼 等 
人 关于 计算 的 基本 思想 发 展 和 应 用 的 有 趣 故 事 。 

我 们 的 主要 目标 是 让 学 生 掌 握 有 效 解决 任何 编程 问题 所 需 的 特定 机 制 和 技能 。 书 中 使 用 
的 代码 都 是 完整 的 Java 程序 ， 读 者 可 以 试 着 使 用 它们 来 学 习 编程 。 需 要 说 明 的 是 ， 本 书 专 
注 于 个 人 编程 ， 并 没有 涉及 大 型 编程 问题 。 

如 何 使 用 本 书 “本 书 适 合 科学 应 用 类 相关 专业 一 年 级 本 科 生 学 习 计算 机 科学 课程 使 用 。 
使 用 本 书 时 ， 大 学 生 可 以 在 相对 熟悉 的 专业 背景 下 学 习 编 程 。 通 过 本 书 和 相关 课程 的 学 习 ， 
学 生 能 够 熟练 地 将 编程 技能 应 用 到 他 们 所 选 专业 的 后 续 课 程 中 ， 并 能 够 认识 到 深入 学 习 计算 
机 科学 是 很 有 意义 的 。 

对 于 计算 机 科学 专业 的 学 生 ， 在 科学 应 用 的 背景 下 学 习 编 程 也 会 受益 良 多 。 为 了 更 好 地 
从 事 科 研 工作 ， 计 算 机 科学 家 需要 具备 关于 科学 方法 的 基本 知识 ， 也 需要 了 解 计算 在 科学 研 
究 中 的 作用 ， 并 应 该 与 生物 学 家 、 工 程 师 或 物理 学 家 等 对 于 这 类 问题 的 认识 保持 一 致 。 

事实 上 ， 我 们 的 跨 学 科 方法 可 以 让 计算 机 科学 专业 的 学 生 和 其 他 专业 的 学 生 在 同一 门 课 
程 中 学 习 编程 。 我 们 涵盖 了 CS1 要 求 的 所 有 内 容 ， 而 且 更 注重 通过 具体 应 用 引出 编程 的 相 
关 概 念 并 吸引 学 生 学 习 。 同 时 ， 我 们 的 跨 学 科 方 法 能 够 让 学 生 接 触 到 来 自 不 同学 科 的 多 种 问 
题 ， 从 而 帮助 他 们 更 明智 地 选择 自己 的 专业 。 

无 论 使 用 哪 种 具体 的 机 制 ， 本 书 都 适合 在 整个 大 学 教学 过 程 的 初期 使 用 。 首 先 ， 这 种 
教学 时 间 的 安排 使 得 我 们 能 够 利用 高 中 的 数学 和 科学 相关 知识 开展 教学 ; 其次， 在 进入 专业 
时 ， 在 大 学 课程 初期 学 习 了 编程 的 学 生 将 能 够 更 有 效 地 使 用 计算 机 。 就 像 阅读 和 写作 一 样 ， 
编程 对 于 任何 科学 家 或 工程 师 来 说 肯定 都 是 必 不 可 少 的 技能 。 掌 握 了 本 书 相关 概念 的 学 生 将 
会 在 他 们 的 一 生 中 不 断 地 发 展 这 种 技能 ， 从 而 能 够 更 好 地 理解 在 他 们 所 选择 的 领域 中 出 现 的 
问题 和 项 目 ， 并 能 够 更 好 地 利用 计算 机 来 解决 它们 。 

前 导 课 程 ” 本 书 适合 一 年 级 本 科 生 。 也 就 是 说 ， 只 需要 科学 和 数学 的 入 门 级 基础 知识 ， 
而 不 再 要 求 其 他 额外 的 知识 作为 前 导 。 

熟练 掌握 数学 工具 和 知识 是 学 习 本 书 的 重要 前 提 。 虽 然 我 们 不 讨论 数学 的 细节 内 容 ， 但 
是 确实 涉及 了 学 生 高 中 所 学 的 数学 课程 ， 包 括 代 数学 、 几 何 学 和 三 角 学 。 我 们 认为 本 书 的 目 
标 受 众 基本 掌握 了 这些 知识 。 事 实 上 ,我们 的 很 多 编程 概念 建立 在 他 们 相对 熟悉 的 初等 数学 
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课程 的 基础 上 。 

科学 好 奇 心 也 是 一 个 重要 的 组 成 部 分 。 理 工科 学 生 天 然 就 迷恋 科学 探究 ， 喜 欢 探究 自然 
界 发 生 的 一 切 。 我 们 利用 他 们 的 这 种 爱好 ， 在 书 中 通过 简单 的 程序 揭示 自然 界 的 规律 。 除 了 
高 中 课程 所 讲授 的 数学 、 物 理 、 生 物 或 化 学 的 基础 知识 以 外 ， 我 们 不 需要 任何 特定 的 知识 。 

编程 经 验 不 是 必需 的 ， 如 果 有 编程 经 验 也 无 妨 。 讲 授 编程 是 我 们 的 主要 目标 之 一 ， 所 以 
我 们 假设 学 生 都 没有 编程 经 验 。 这 是 一 本 入 门 性 质 的 编程 书 ， 但 是 那些 在 高 中 编写 了 大 量程 
序 的 学 生 也 可 以 在 学 习 中 有 所 收获 ， 因 为 本 书 中 涉及 的 问题 都 是 跨 学 科 的 新 问题 ， 而 通过 纺 
程 解决 新 问题 往往 是 具有 挑战 性 的 智力 任务 。 本 书 适合 具有 不 同 背 景 的 学 生 阅读 ， 因 为 这 些 
应 用 程序 对 新 手 和 专家 都 有 吸引 力 。 

学 生 不 必 具 备 使 用 计算 机 的 经 验 。 当 然 ， 大 学 生 经 常 使 用 计算 机 。 例 如 ， 与 亲友 交流 、 
听 音 乐 、 处 理 照片 ， 等 等 。 在 本 书 的 学 习 中 ， 他 们 将 意识 到 能 够 以 更 有 趣 而 且 更 加 重要 的 方 
式 利用 自己 的 计算 机 ， 这 会 是 一 个 激动 人 心 同时 又 持久 的 过 程 。 

总 之 ,几乎 所 有 的 大 学 生 都 可 以 在 第 一 学 期 的 课程 中 学 习 本 书 的 内 容 。 

目标 ”对 于 那些 完成 了 本 书 课程 的 学 生 ， 当 他 们 开始 学 习 理工 科 的 高 年 级 课程 时 ,他们 
的 教师 会 对 他 们 有 什么 期 待 呢 ? 

本 书 涵盖 了 CS1 课程 ， 但 是 任何 教 过 编程 基础 课程 的 人 都 知道 ， 在 后 续 课 程 中 ， 教 师 
的 期 望 通常 很 高 : 每 位 教师 都 希望 所 有 的 学 生 能 够 熟悉 计算 机 环境 和 课程 中 所 要 使 用 的 方 
法 。 物 理学 教授 可 能 会 期 望 学 生 在 周末 设计 一 个 程序 来 进行 模拟 ， 工 科教 授 可 能 会 期 望 学 生 
使 用 一 个 特定 的 包 来 实现 微分 方程 的 数值 求解 ， 计 算 机 科学 教授 可 能 期 望 学 生 了 解 特定 编程 
环境 的 细节 。 一 个 人 门 级 课程 满足 如 此 多 样 化 的 期 望 ， 这 现实 吗 ?” 每 类 学 生 都 应 该 有 不 同 的 
入门 课程 吗 ? 

自 20 世纪 后 半期 计算 机 广泛 使 用 以 来 ， 高 等 院 校 一 直 受 这 些 问 题 的 困扰 。 我 们 利用 本 
书 给 出 了 这 些 问 题 的 答案 。 这 是 一 本 介绍 通用 编程 方法 的 教材 ， 类 似 于 普遍 接受 的 数学 、 物 
理 、 生 物 和 化 学 等 学 科 的 人 门 课程 。 本 书 致力 于 为 所 有 理工 科学 生 提 供 所 需 的 基础 知识 ， 同 
时 传递 出 二 个 清晰 的 信号 ， 即 对 计算 机 科学 的 了 解 远 不 止 程序 设计 这 么 简单 。 完 成 了 本 书 的 
学 习 ， 我 们 相信 学 生 将 具备 必要 的 知识 和 经 验 ， 能 够 适应 新 的 计算 环境 ， 并 在 不 同 的 应 用 程 
序 中 有 效 地 利用 计算 机 。 

对 于 学 生 而 言 ， 学 完了 本 书 对 应 的 课程 之 后 ， 在 后 续 的 学 习 中 可 以 尝试 什么 新 的 课程 呢 ? 

我 们 认为 编程 并 不 难 学 ， 而 且 学 会 利用 计算 机 的 力量 是 非常 有 价值 的 。 掌 握 了 本 书 内 容 
的 学 生 ， 以 后 将 有 能 力 应 对 职业 生涯 中 出 现 的 各 类 计算 机 使 用 上 的 挑战 。 他 们 学 习 了 如 Java 
提供 的 现代 编程 环境 ， 有 助 于 打开 任何 以 后 可 能 遇 到 的 计算 问题 的 大 门 ， 并 有 足够 的 信心 学 
习 、 评 估 和 使 用 其 他 新 的 计算 工具 。 对 计算 机 科学 感 兴趣 的 学 生 能 够 具备 深入 学 习 的 基础 知 
识 ， 其 他 理工 科学 生 则 可 具备 将 计算 融 人 其 他 研究 中 的 能 力 。 

本 书 官网 9 ”在 下 面 的 网 站 中 ， 可 以 找到 本 书 的 大 量 补充 信息 和 其 他 相关 材料 : 

http://introcs.cs.princeton.edu/java 

为 了 简单 起 见 ， 我 们 以 后 不 再 写 出 网 址 ， 而 简写 为 本 书 官网 。 网 站 上 提供 了 面向 教师 、 
学 生 和 普通 读者 的 材料 。 我 们 在 这 里 对 这 些 材料 进行 简要 介绍 ， 读 者 可 以 进入 网 站 浏览 和 查 
看 详细 内 容 。 除 了 一 些 用 于 考试 的 材料 外 ， 其 他 材料 都 是 公开 的 。 


”本 书 官网 及 网 站 上 的 资源 由 原 书 作者 提供 和 维护 ， 资 源 的 可 获取 性 、 准 确 性 、 安 全 性 由 网 站 所 有 者 负责 ， 
我 社 不 承担 任何 责任 。 一 一 编辑 注 
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建立 本 书 官网 最 重要 的 意义 之 一 就 是 帮助 教师 和 学 生 使 用 自己 的 计算 机 来 讲授 和 学 习 
本 书 中 的 材料 。 任 何 拥有 计算 机 和 浏览 器 的 人 都 可 以 按照 本 书 官网 上 列 出 的 方法 开始 学 习 编 
程 。 这 个 过 程 不 会 比 下载 媒 体 播放 器 或 歌曲 更 困难 。 与 其 他 网 站 二 样 ， 本 书 官网 也 在 不 断 发 
展 。 对 于 拥有 本 书 的 每 个 人 来 说 ， 这 是 必 不 可 少 的 资源 。 需 要 特别 说 明 的 是 ;网 站 上 提供 了 
更 多 的 补充 材料 ， 这 些 材 料 对 于 学 习 本 书 知识 至 关 重 要 ， 能 够 促进 计算 机 科学 成 为 所 有 科学 
家 和 工程 师 所 接受 的 基础 教育 的 一 个 重要 组 成 部 分 。 

对 于 教师 来 说 ， 该 网 站 包含 有 关 教 学 的 信息 。 在 过 去 十 年 中 ;我 们 每 周 组 织 两 次 大 规模 
的 授课 ， 并 辅 以 每 周 两 次 的 讨论 ， 学 生 以 小 组 为 单位 与 教师 或 助教 进行 交流 。 在 这 些 教学 过 
程 中 ,我 们 形成 了 自己 的 一 套 教学 风格 ， 并 按照 这 套 风格 组 织 了 教学 材料 。 本 书 官网 中 给 出 
了 授课 的 演示 幻灯 片 。 

对 于 助教 来 说 ， 这 个 网 站 包含 了 详细 的 习题 集 和 编程 任务 ， 这 些 都 是 与 书 中 的 练习 相对 
应 的 ， 而 且 加 入 了 更 多 的 细节 。 每 个 编程 任务 都 会 在 一 个 有 趣 的 应 用 环境 中 介绍 二 个 相关 的 
概念 ， 同 时 向 学 生 提 出 一 个 充满 吸引 力 又 有 些 难 度 的 问题 。 任务 难度 的 递 进 体现 了 我 们 的 教 
学 方法 。 本 书 官网 详细 说 明了 所 有 的 作业 ， 并 提供 了 详细 的 、 条 理 清晰 的 辅助 材料 ， 以 帮助 
学 生 在 规定 的 时 间 内 完成 它们 。 辅 助 材料 包括 建议 的 解决 方法 ,以 及 在 讨论 课 上 讲授 的 内 容 
大 纲 。 

对 于 学 生来 说 ， 通 过 该 网 站 可 以 快速 访问 本 书 中 的 大 部 分 内 容 ; 包括 源 代码 以 及 一 些 建 
议 自学 的 课外 材料 。 本 书 官网 也 提供 了 许多 书 中 习题 的 答案 ， 包 括 完整 的 程序 代码 和 测试 数 
据 。 网 站 上 还 有 大 量 与 编程 任务 相关 的 信息 ， 包 括 建议 的 方法 :清单 、 常 见 问题 解答 和 测试 
数据 等 。 

对 于 普通 读者 来 说 ， 可 以 通过 本 书 官网 访问 与 书籍 内 容 相 关 的 所 有 额外 信息 。 所 有 网 站 
上 的 内 容 都 提供 了 链接 和 其 他 信息 渠道 ， 以 供 读 者 获取 关于 该 主题 的 更 多 信息 。 网 站 上 的 内 
容 非 常 丰富 ， 远 远 超出 了 读者 的 需求 ， 我 们 的 目标 是 提供 足够 多 的 信息 ， 确 保 能 够 满足 每 位 
读者 对 本 书 内 容 深 入 学 习 的 需求 。 

致谢 这 个 项 目 自 1992 年 启动 以 来 二 直 处 于 不 断 的 发 展 中 ， 到 目前 为 目 ， 有 太 多 的 人 
为 本 书 的 成 功 做 出 了 贡献 ， 我 们 在 这 里 感谢 这 一 切 。 特 别 感谢 Anne Rogers 从 开始 一 直 帮 助 
这 个 项 目 ; 感谢 Dave Hanson、Andrew Appel 和 Chris van Wyk 耐心 地 解释 数据 抽象 ; 感谢 
Lisa Worthington 和 Donna Gabai 最 早 尝试 向 一 年 级 学 生 讲 授 本 教材 ， 这 是 一 个 非常 大 的 挑 
战 ; 感谢 Doug Clark 耐心 帮助 我 们 完善 了 图 灵机 构建 和 电路 的 知识 。 我 们 也 非常 感谢 / dev / 
126 9 的 努力 ; 感谢 普林斯顿 大 学 25 年 来 一 直 致 力 于 讲授 这 本 教材 的 教师 、 研究生 和 教学 人 
员 ， 以 及 成 千 上 万 名 努力 学 习 本 书 的 大 学 生 。 
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编程 元 素 





阅读 完 本 章 ， 你 将 相信 和 写 程序 不 会 比 撰写 文章 更 难 。 相 反 ， 写 作 相对 要 更 难 一 些 ， 因 此 
我 们 花费 数 年 时 间 在 学 校 学 习 如 何 写 作 。 而 通过 程序 模块 ,我们 就 可 以 解决 很 多 令 人 头疼 的 
程序 编写 问题 。 本 章 将 类 基础 的 Java 开始 ， 通 过 讲授 程序 模块 ， 教 给 你 各 种 有 趣 的 编程 知 
识 。 可 能 通过 数 周 的 学 习 ， 你 就 可 以 掌握 用 编写 程序 来 表达 自己 的 想法 的 技能 。 如 同 写作 一 
样 , 一旦 学 会 编程 技能 ， 将 对 你 的 未 来 产生 深远 的 影响 ， 并 贯穿 你 的 整个 人 生 。 

本 书 中 你 将 学 到 的 是 Java 编程 语言 (Java programming language)。 这 个 任务 比 学 习 外 
语 要 容易 得 多 。 事 实 上 ， 程 序 语言 只 包含 几 十 个 常用 词汇 和 语法 规则 。 本 书 中 涉及 的 内 容 也 
可 以 用 Python、C++ 或 其 他 一 些 现 代 编 程 语言 来 表达 。 本 书 中 ， 我们 尽 可 能 地 用 Java 来 讲 
授 ， 以 使 读者 尽快 地 学 会 创建 和 运行 程序 。 一 方面 ， 我 们 聚焦 于 讲解 如 何 编程 ， 而 不 是 如 何 
使 用 Java ; 另 一 方面 ， 编 程 的 部 分 难点 就 在 于 把 握 特 定 条 件 下 的 程序 细节 。 使 用 Java 进行 
编程 ， 可 以 让 你 适应 多 种 计算 机 ， 也 可 以 帮助 你 快速 地 学 习 其 他 语言 ， 如 入 门 阶段 的 C 语 
言 和 专业 的 Matlab 语言 。 


1.1 你 的 第 一 个 程序 


在 本 节 中 ， 通 过 学 习 程序 运行 的 基本 步 又， 我 们 将 带领 你 进入 Java 编程 世界 。 与 许多 
你 习惯 使 用 的 其 他 应 用 程序 (如 文字 处 理 程序 、 电 子 邮 件 程序 和 Web 浏览 器 ) 不 同 ，Java 平 
台 (以 下 简称 Java) 是 一 系列 应 用 程序 的 组 合 。 与 任何 应 用 程序 一 样 ， 你 需要 确保 Java 已 正 
确 安装 在 计算 机 上 。 大 多 数 计算 机 预 装 有 Java， 若 没有 ， 也 可 以 自行 下 载 。 同 时 ， 你 还 需要 
一 个 文本 编辑 器 和 一 个 终端 应 用 程序 。 接 下 来 ， 登 录 如 下 网 址 : 

http://introcs.cs.princeton.edu/java 
可 以 查找 到 安装 Java 编程 环境 的 说 明 。 在 后 续 的 章节 中 ， 我们 把 这 个 网 站 称 为 本 书 官网 
(booksite)， 它 涵盖 本 书 的 大 量 补充 信息 和 参考 资料 。 

Java 编程 ”为 介绍 方便 ， 我 们 将 程序 开发 划分 为 以 下 三 个 步 又: 

。 创建 (create) 名 为 MyProgram.java 的 程序 。 

。 在 终端 窗口 中 键入 javac MyProgram.java 进行 编译 (compile)。 

。 在 终端 窗口 中 键 人 java MyProgram 来 执行 (execute) 或 运行 (run) ) 它 。 

第 一 步 ， 你 需要 在 空白 屏幕 上 键 人 一 系列 字符 ， 就 像 撰写 电子 邮件 或 文章 一 样 。 程 序 员 
使 用 代码 ( code) 来 表示 程序 文本 ， 使 用 编码 (coding) 来 表示 创建 和 编辑 代码 的 行为 。 第 二 
步 ， 利 用 系统 应 用 来 编译 你 的 程序 (即将 你 的 程序 编译 成 更 适合 计算 机 的 语言 形式 )， 并 将 运 
行 结果 保存 至 文件 MyProgram.class。 第 三 步 ， 将 计算 机 的 控制 权 从 操作 系统 转移 到 你 的 程序 
《完成 后 再 将 控制 权 返 回 给 操作 系统 )。 我 们 有 多 种 不 同 的 方式 来 创建 、 编 译 和 执行 程序 。 对 于 
小 程序 来 说 ， 下 面 我 们 给 出 的 这 一 系列 顺序 是 最 容易 描述 和 使 用 的 。 

创建 程序 。Java 程序 实际 上 只 不 过 是 一 系列 字符 ， 像 一 段 文字 或 者 一 首 诗 一 样 存储 
在 一 个 扩展 名 为 .java 的 文件 中 。 因 此 ， 要 创建 一 个 Java 程 序 ， 你 只 需要 简单 地 输入 该 字 
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符 序列 ， 就 像 你 输入 电子 邮件 或 任何 其 他 计算 机 应 用 程序 一 样 。 你 可 以 使 用 任何 文本 编 
辑 器 (text editor)， 也 可 以 使 用 本 书 官网 上 推荐 的 更 复杂 的 集成 开发 环境 工具 ( integrated 
development environment)。 这 些 工具 的 功能 对 于 完成 我 们 本 书 中 涉及 的 各 种 程序 来 说 绰 绰 
有 余 ， 但 它们 使 用 起 来 并 不 困难 ， 而 且 具 有 许多 有 用 的 特性 ， 并 在 实际 的 软件 开发 中 被 专业 
人 士 广 泛 使 用 。 

编译 程序 。 通 常 ， 初 学 者 认为 Java 是 最 便于 计算 机 理解 的 编译 语言 ， 但 事实 上 ，Java 
是 最 便于 程序 员 理 解 的 编译 语言 。 计 算 机 的 语言 比 Java 更 原始 。 编 译 器 ( compiler) 是 将 程 
序 从 Java 语言 转换 为 更 适合 在 计算 机 上 执行 的 语言 的 应 用 程序 。 编 译 器 使 用 .java 扩展 名 的 
文件 作为 输入 (你 的 程序 ) 并 生成 一 个 文件 名 相同 但 带 有 .class 扩展 名 (计算 机 语言 版 本 ) 的 
文件 。 要 使 用 Java 编译 器 ， 需 要 在 终端 窗口 中 键入 javac 命令， 后 面 跟着 要 编译 的 程序 的 文 
件 名 即 可 。 所 

执行 (运行 ) 程序 。 一 旦 程序 编译 成 功 ， 你 就 可 以 执行 (或 运行 ) 它 。 这 是 最 激动 人 心 
的 时 刻 ， 你 的 程序 将 会 控制 你 的 计算 机 (在 Java 允许 的 范围 之 内 )， 或 者 应 该 说 让 你 的 计算 
机 遵循 你 的 指示 。 更 准确 地 说 ，Java 虚拟 机 (简称 JVM) 命令 计算 机 听从 你 的 指示 。 若 使 用 
JVM 执行 程序 ， 请 在 终端 窗口 中 键入 java 命令 ， 然 后 键入 程序 名 称 。 


使 用 任何 一 个 文本 键入 javac He11o- 键入 java He11o- 
编辑 器 创建 你 的 程序 Wor1d. java 来 编译 程序 Wor1d 来 执行 你 的 程序 


| | 
的 名 吕 -aelloworaa. java 一 HelloWorld.class— "Hello, World" 
| | | 


你 的 程序 所 写 程序 的 计 输出 
(一 个 六 标尺 什 】 算 机 语言 版 本 


开发 一 个 Java 程序 的 过 程 



















程序 1.1.1 Hello, World 
public class HelloWorld 
上 


public static void main(String[] args) 
{ 






/ 在 终端 窗口 中 打印 “Hello, World” 

System.out.printin("Hello, World"); 
} 

} 





该 代码 是 一 个 完成 简单 任务 的 Java 程 序 ， 也 是 初学 者 的 第 一 个 程序 。 下 面 的 
方 框 显示 了 编译 和 执行 该 程序 的 结果 。 终 端 应 用 程序 输出 命令 提示 符 (本 书 中 为 % 
符号 ) ， 并 执行 你 键入 的 命令 ( 以 下 示例 中 首先 为 javac， 然 后 为 java ) 。 按 照 
惯例 ， 我 们 将 输入 文字 高 亮 加 粗 ， 输 出 字体 则 为 正常 字体 。 在 这 个 例子 中 ， 程序 
结果 是 在 终端 窗口 中 输出 文本 : Hello,World。 





% javac HelloWworld. java 
% java HelloWorld 
Hello, World 


程序 1.1.1 是 一 个 完整 的 Java 程序 的 例子 。 它 的 名 字 是 HelloWorld， 它 的 代码 应 该 存 
储 在 一 个 名 为 HelloWorld.java 的 文件 中 (这 是 Java 中 的 文件 命名 惯例 )。 这 个 程序 的 唯一 功 
能 是 将 消息 打印 到 终端 窗口 。 为 了 全 书 的 统一 性 ， 我 们 将 使 用 一 些 标准 的 Java 术语 来 描述 
程序 ， 你 现在 可 能 还 不 理解 这 些 术 语 是 什么 意思 ， 我 们 将 会 在 本 书后 面 的 章节 给 出 它们 的 具 
体 定义 : 程序 1.1.1 由 一 个 名 为 HelloWorld 的 类 (class) 组 成 ， 这 个 类 里 只 包含 了 一 个 名 为 
main() 的 方法 ( method)( 当 引用 文本 中 的 方法 时 ， 我们 在 名 称 后 面 加 上 小 括号 “()”， 这 样 
就 可 以 把 它们 与 其 他 类 型 的 名 称 区 别 开 来 )。 在 2.1 节 之 前 ， 我 们 所 有 的 类 都 将 具有 相同 的 
结构 ， 因 此 你 可 以 暂时 将 “类 ”理解 为 “程序 ”。 

每 一 个 方法 的 第 一 行 定义 名 称 和 其 他 信息 ; 接 下 来 的 语句 ( statement) 序列 用 大 括号 括 
起 来 ， 每 行 以 分 号 隔 开 。 目 前 ， 你 可 以 将 “编程 ” 视 为 “指定 一 个 类 的 名 称 ， 然 后 给 这 个 类 
的 maing) 方法 指定 一 系列 语句 ”的 过 程 ， 程 序 的 核心 就 是 main() 方法 中 的 语句 序列 ， 即 它 
的 方法 体 (body)。 程 序 1.1.1 包含 两 个 语句 : 

。 第 一 行 语 句 是 注释 语句 (comment)， 是 程序 的 说 明文 档 。 

在 Java 中 ， 单 行 注 释 以 两 个 “ /六 字符 开始 ， 直 到 本 行 结尾 。 在 本 书 中 ， 我 们 将 
注释 显示 为 灰色 。 这 些 注释 可 以 供 人 类 阅读 ， 但 Java 会 直接 跳 过 。 

。 第 二 个 语句 是 打印 语句 (print statement)。 它 调用 名 为 System.out.println() 的 方法 将 

文本 消息 (一 对 双 引 号 之 间 的 字符 串 ) 打印 到 终端 窗口 。 

在 接 下 来 的 两 节 中 ， 你 将 学 到 许多 其 他 不 同类 型 的 语句 ， 可 以 用 来 编写 更 加 复杂 的 程 
序 。 目 前 ,我 们 只 使 用 注释 和 打印 语句 ， 就 像 HelloWorld 程序 中 使 用 的 那样 。 

当 你 在 终端 窗口 中 键入 java， 后 跟 一 个 类 名 时 ， 系 统 将 调用 在 该 类 中 定义 的 main() 方 
法 ， 并 逐个 执行 其 语句 。 因 此 ， 键入 java HelloWorld 会 导致 系统 调用 程序 1.1.1 中 的 main() 
方法 并 执行 它 的 两 个 语句 。 第 一 个 语句 是 Java 忽略 的 注释 。 第 二 个 语句 将 指定 的 消息 打印 
到 终端 窗口 。 

名 为 He11oWor1d. 
java 的 文本 文件 


类 名 , 

| main() 方 法 

public class| HelloWorld SA 
{ 


public static void main(String[] args) 















{ 
// 在 终端 窗口 中 打印 "He110o，World" 
System.out .print("He11o， | 

} 
sc 一 | 
证人 器 

方法 体 

程序 各 部 分 解析 


自 20 世纪 70 年 代 以 来 ， 程序 员 在 入 门 时 编写 的 第 一 个 程序 就 是 打印 “Hello，World”， 
这 已 经 成 为 一 个 传统 。 所 以 ， 你 应 该 将 程序 1.1:1 中 的 代码 输入 文件 ， 编 译 并 执行 。 通 过 这 
个 过 程 ， 你 就 可 以 跟随 无 数 前 辈 的 脚步 学 习 编程 。 此 外 ， 你 也 可 以 顺便 检查 你 是 否 具 有 可 用 
的 编辑 器 和 终端 应 用 程序 。 刚 开始 ， 完 成 在 终端 窗口 中 打印 消息 这 样 一 个 简单 的 任务 可 能 看 
起 来 比较 无 趣 。 然 而 ,通过 打印 功能 ,我 们 可 以 直观 地 看 到 程序 在 做 什么 ， 而 这 也 恰好 是 编 
程 最 基本 的 功能 之 一 。 


Le] 


了 吉 X 阐 


从 现在 开始 ， 我 们 编写 的 所 有 程序 代码 都 与 程序 1.1.1 基本 一 样 ， 只 是 main() 方法 中 的 
语句 序列 不 同 。 因 此 ， 你 不 需要 从 零 开 始 编写 每 一 段 程序 。 相 反 ， 你 可 以 这 样 : 

。 将 HelloWorld.java 复制 为 一 个 新 文件 ， 然 后 重新 给 新 文件 命名 ， 扩 展 名 为 .java。 

。 将 文件 中 第 一 行 的 HelloWorld 替换 为 新 的 程序 名 称 。 

。 将 原来 程序 中 的 注释 和 打印 语句 替换 成 不 同 的 Java 语句 。 

程序 因 程序 名 称 和 程序 语句 的 不 同 有 所 区 别 。 每 个 Java 程序 必须 存储 在 一 个 文件 中 ， 
而 这 个 文件 的 名 称 必 须 与 程序 中 class 后 的 词 相同 ， 它 的 扩展 名 也 必须 是 .java。 

错误 。 初 学 者 很 容易 混淆 编辑 、 编 译 和 执行 程序 之 间 的 区 别 。 当 你 学 习 编 程 时 ， 应 该 
将 这 些 过 程 分 开 ， 以 便 发 生 错 误 的 时 候 能 够 清楚 地 找到 原因 。 编 程 过 程 中 出 现 错误 是 不 可 避 
免 的 。 

你 可 以 通过 在 创建 程序 时 仔细 检查 程序 来 修改 或 避免 大 多 数 错误 就 像 你 在 编写 电子 邮 
件 时 仔细 检查 并 修改 拼写 和 语法 错误 一 样 。 在 编译 程序 时 会 出 现 一 些 错误 ， 我 们 称 之 为 编译 
时 错误 (compile-time error)， 因 为 这 些 错 误会 阻止 编译 器 进行 后 续 的 代码 翻译 。 对 于 编译 完 
成 后 ， 在 执行 程序 时 才 出 现 的 错误 ,我 们 将 其 称 为 运行 时 错误 (run-time error)。 

一 般 来 说 ,程序 中 的 错误 也 被 称 为 Bug。Bug 是 程序 员 的 天 敌 : 因为 报错 信息 可 能 会 令 
人 困惑 ， 错 误 的 来 源 可 能 很 难 找到 。 因 此 ， 你 首先 要 学 习 的 是 识别 错误 。 你 会 学 着 在 编码 时 
小 心 谨 慎 ， 避 免 出 现 这 些 错误 。 本 节 最 后 的 问答 环节 显示 了 常见 的 Bug 示例 。 













程序 1.12 “使 用 命令 行 参数 





public class UseArgument 


public static void main(String[] args) 






System.out.print("Hi, "); 

System.out.print(args[0]); 

System.out.printin(". How are you?"); 
} 

} 








该 程序 显示 了 我 们 如 何 控 制程 序 行为 :在 命令 行 中 提供 一 个 参数 , 程序 就 会 
把 这 个 参数 打印 出 来 。 通 过 参数 我 们 能 够 控制 程序 的 行为 。 







% javac UseArgument .java 
% java UseArgument Alice 
Hi, Alice. How are you? 
% java UseArgument Bob 
Hi, Bob. How are you? 


输入 和 输出 通常 ,我 们 在 程序 中 提供 输入 参数 (input)， 程 序 会 据 此 产生 输出 。 
UseArgument (程序 1.1.2) 中 展示 了 提供 输入 数据 的 最 简单 方法 。 每 当 执 行程 序 UseArgument 
时 ， 它 会 接受 在 程序 名 称 之 后 键入 的 命令 行 参 数 ， 并 将 其 作为 消息 的 一 部 分 打印 回 终 端 窗口 。 
执行 此 程序 的 结果 取决 于 你 在 程序 名 称 后 键入 的 内 容 。 通 过 使 用 不 同 的 命令 行 参数 执行 程 
序 ， 可 以 生成 不 同 的 打印 结果 。 我 们 将 在 稍 后 的 .2.1 节 中 更 详细 地 讨论 用 来 将 命令 行 参数 传 
递 给 程序 的 机 制 。 现 在 可 以 简单 理解 为 args [0] 是 你 在 程序 名 称 后 输入 的 第 一 个 命令 行 参数 ， 
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args [1] 是 第 二 个 ， 以 此 类 推 。 因 此 ， 你 可 以 在 程序 体 中 使 用 args [0] 来 表示 你 在 命令 行 上 键 
人 的 第 一 个 字符 串 ，UseArgument 程序 中 就 是 这 么 做 的 。 

除了 System.out.println() 方法 之 外 ，UseArgument 也 调用 了 System.out.print() 方法 。 这 
个 方法 与 System.out.println() 相似 , 但 是 它 只 打印 指定 的 字符 串 (而 不 再 在 字符 串 的 后 面 加 
一 个 换行 符 )。 

就 像 前 边 提 到 的 ， 或许 你 会 认为 ， 编写 一 个 这 样 的 打印 程序 不 过 尔 尔 ， 但 事实 上 ， 这 也 
是 程序 可 以 实现 的 基本 功能 之 一 一 一 使 得 用 户 能 够 控制 程序 的 执行 3 UseArgument 代表 的 简 
单 模型 足够 使 我 们 思考 Java 的 基本 编程 机 制 ， 并 可 解决 各 种 有 趣 的 计算 问题 。 

不 难 发 现 ，UseArgument 程序 准确 地 将 命令 行 参数 中 的 字符 串 映射 到 终端 窗口 。 使 用 它 
时 ,我 们 可 能 将 Java 程序 视 为 一 个 转化 箱 ， 即 将 一 段 输入 字符 转化 为 输出 字符 。 

这 个 模型 是 有 吸引 力 的 ， 因 为 它 不 仅 简 单 ， 而 且 还 足够 普遍 ， 原 则 上 可 以 完成 任何 计算 
任务 。 例 如 ，Java 编译 器 本 身 就 是 一 个 程序 ， 它 只 需要 一 个 字符 二 jee 输 关 字符 由 
串 输入 ( :java 文件) 并 生成 男 一 个 字符 串 作为 输出 (相应 的 
.class 文件 )。 在 后 面 的 学 习 中 ， 你 将 能 够 编写 完成 各 种 有 趣 任 务 
的 程序 (尽管 并 非 像 编译 器 那么 复杂 的 程序 )。 目 前 ,我 们 的 程 
序 对 于 输入 和 输出 数据 的 大 小 和 类 型 还 有 限制 。 在 1.5 节 中 ， 你 
将 看 到 如 何 将 更 复杂 的 机 制 用 于 程序 的 输 大 和 输出 5 特别 是 ， 你 ice How 各 you? 
将 看 到 我 们 可 以 使 用 任意 长 的 输入 和 输出 字符 串 ， 甚 至 可 以 使 用 Jave 程 说 的 查 观 图 
其 他 类 型 的 输入 数据 ， 如 声音 和 图 片 等 。 
问答 环节 

问 : 为 什么 选择 Java ? 

答 : 编写 程序 时 ， 用 儿 种 常用 语言 写 出 的 代码 非常 相似 ， 所 以 选择 哪 种 语言 并 不 重要 。 
我 们 使 用 Java， 因 为 它 使 用 广泛 ， 而 且 支 持 现代 的 抽象 数据 类 型 ， 并 能 够 自动 识别 程序 中 的 
多 种 错误 ， 因 此 它 非常 适合 于 编程 学 习 。 世 上 没有 完美 的 语言 ， 你 以 后 肯定 还 会 用 其 他 语言 
来 编程 。 

问 : 我 相信 书 中 各 个 程序 均 可 运行 且 结 果 正 确 ， 是 否 还 需要 亲自 尝试 ? 

答 : 每 个 人 都 应 该 试 着 输入 并 运行 HelloWorld 程序 。 同时， 每 个 人 都 可 以 在 输入 和 运 
行 UseArgument 程序 时 ， 输 入 自己 的 个 性 化 参数 ， 查 看 结果 ， 这 有 助 于 你 对 程序 的 理解 。 为 
减少 打字 工作 量 本 书 官网 上 展示 了 所 有 代码 示例 。 该 网 站 还 提供 有 关 如 何在 你 的 计算 机 上 安 
装 和 运行 Java 的 信息 、 部 分 练习 的 答案 、 网 络 链接 以 及 编程 时 可 能 会 用 到 的 其 他 附加 信息 。 

问 : public 、static 和 void 这 几 个 词 的 含义 是 什么 ? 

答 : 这 些 关 键 字 指 定 main() 函数 的 某 些 属性 ， 你 将 在 本 书后 面 的 内 容 中 学 到 它们 。 目 
前 ,我 们 只 需要 知道 这 些 是 关键 字 ， 在 代码 中 需要 使 用 它们 (因为 它们 是 必需 的 )。 

问 : 在 程序 代码 中 /二 和 所 字符 的 含义 是 什么 ? 

答 : 它们 表示 注释 ， 注 释 的 相关 内 容 会 被 编译 器 忽略 。 注 释 是 “/*” 和 “*/” 之 间或 
“/W/” 后 的 文字 。 注 释 是 不 可 或 缺 的 ， 因 为 它们 能 够 帮助 其 他 程序 员 了 解 你 的 代码 ,甚至 帮 
助 你 在 追溯 代码 时 了 解 自身 。 限 于 本 书 排版 格式 的 要 求 ， 我 们 在 程序 中 不 能 大 量 使 用 注释 ， 
因此 ,我 们 只 能 在 正文 中 使 用 相应 的 文字 和 图 表 来 详细 描述 每 个 程序 。 本 书 官网 上 提供 的 程 
序 代码 都 包含 了 更 为 详尽 的 注释 。 





输出 字符 串 
a 
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问 : Java 中 使 用 制 表 符 、 空 格 和 换行 符 的 规则 有 哪些 ? 
答 : 这 些 字符 统称 为 空白 字符 。Java 编译 器 将 程序 文本 中 的 所 有 空白 都 视 为 等 效 的 。 例 
如 ， 我 们 可 以 按照 下 面 的 方式 写 HelloWorld 程序 : 


public class Helloworld { public static void main ( ER 
[] args) { System.out.printin("Hello, World") 


这 仍然 是 可 以 正常 编译 的 代码 。 但 是 ， 当 编写 Java 程序 时 ， 我 们 通常 会 遵循 约定 的 规 
则 控制 间距 和 缩 进 ， 就 像 我 们 在 写 散文 或 诗歌 时 缩 进 段落 和 行 一 样 。 

问 : 引号 如 何 使 用 ? 

答 : 前 后 引号 中 的 字符 会 被 精确 地 指定 为 要 打印 的 内 容 。 与 上 一 问题 中 提出 的 连续 空 
格 作为 空白 字符 不 同 ， 如 果 你 在 引号 内 输入 了 若干 个 连续 的 空格 ， 那 么 输出 时 就 会 显示 相应 
数量 的 空格 。 如 果 你 不 小 心 忽略 了 反 引 号 ， 编 译 器 可 能 会 非常 困惑 ， 因 为 引号 总 是 成 对 出 现 
的 ,一 对 引号 用 于 将 字符 串 中 的 字符 和 程序 的 其 他 部 分 区 分 开 。 

问 : 当 你 漏 写 了 一 个 大 括号 或 拼写 错 一 个 单词 (如 public、static、void 或 main) 时 ,会 
发 生 什么 ? 

答 : 这 取决 于 你 输入 的 内 容 。 这 种 错误 称 为 语法 错误 (syntax error)， 通 常 由 编译 器 
捕获 。 例 如 ， 我 们 编写 一 个 与 HelloWorld 完全 相同 的 程序 Bad， 只 是 漏 掉 了 第 一 个 左 大 
括号 所 在 的 行 (并 将 程序 名 称 从 HelloWorld 更 改 为 Bad)， 那 么 在 编译 时 将 获得 以 下 信息 : 


% javac Bad.java 
Bad.java:1: error: '{' expected 
public class Bad 

入 


1 error 


从 消息 中 你 可 能 会 推测 出 你 需要 插 人 一 个 左 大 括号 。 但 编译 器 可 能 无 法 准确 地 告诉 你 犯 
了 什么 错误 ， 所 以 错误 消息 可 能 难以 理解 。 例 如 ， 如 果 漏 掉 的 是 第 二 个 左 大 括号 而 不 是 第 一 
个 左 大 括号 ， 则 会 收 到 以 下 消息 : 


% javac Bad.java 
Bad.java:3: error: ';' expected 
public static void main(String[] args) 
入 


Bad.java:7: error: class, interface, or enum expected 


入 
2 errors 


想 要 了 解 这 些 消息 ， 可 以 使 用 的 一 种 方法 是 故意 将 错误 引入 一 个 简单 的 程序 中 ， 然 后 看 
看 会 发 生 什么 。 无 论 错 误 消 息 是 什么 ， 你 都 应 该 把 编译 器 当成 一 个 朋友 ， 因 为 它 会 告诉 你 程 
序 存在 什么 问题 。 

问 : 还 有 哪些 我 可 以 使 用 的 Java 方法 ? 

答 : Java 的 方法 有 几 千 个 。 从 下 一 节 开 始 ， 我们 会 逐步 介绍 它们 。 

问 : 运行 UseArgument 程序 时 弹出 一 个 奇怪 的 错误 消息 。 这 是 什么 问题 ? 

答 : 很 可 能 你 漏 掉 了 一 个 命令 行 参数 : 


% java UseArgument 
Hi, Exception in thread “main” 
java.1lang.ArrayIndexOutOfBoundsException: 0 

at UseArgument.main(UseArgument.java:6) 
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Java 提示 你 运行 程序 时 没有 按照 约定 键入 命令 行 参 数 。 你 将 在 1.4 节 中 了 解 有 关 数 组 索 
引 的 更 多 详细 信息 。 记 住 这 个 错误 消息 一 一 你 可 能 会 再 次 看 到 它 。 即 使 经 验 丰 富 的 程序 员 也 
会 偶尔 忘记 键入 命令 行 参数 。 
练习 


1.1.1 编写 一 个 打印 10 次 “Hello, World” 消 息 的 程序 。 
1.1.2 ”描述 如 果 在 HelloWorld.java 中 删 掉 以 下 内 容 ， 将 会 发 生 什么 : 





a. public b. static 
c. void d. args 
1.1.3 ”描述 如 果 在 HelloWorld.java 中 拼 错 (如 漏 掉 第 二 个 字母 ) 以 下 内 容 ， 将 会 发 生 什么 : 
a. public b. static 
c. void d. args 


1.1.4 ”如 果 在 HelloWorld.java 的 print 语句 中 将 双 引 号 放 在 不 同 的 行 上 ， 如 下 所 示 ， 描 述 一 下 会 发 生 什么 : 


System.out.printin("Hello, 


World"); 
1.1.5 如 果 你 尝试 使 用 以 下 命令 行 执行 UseArgument， 描 述 一 下 会 发 生 什么 : 
a. Java UseArgument java b. java UseArgument @!&’% 
c. java UseArgument 1234 d. java UseArgument.java Bob 


e. java UseArgument Alice Bob 

1.1.6 ”参考 程序 UseArgument.java 并 创建 一 个 新 程序 UseThree.java : 它 需 要 三 个 名 字 作 为 命令 行 参 
数 ， 并 按照 给 定名 字 相 反 的 顺序 将 它们 打印 出 来 ， 如 输入 “java UseThree Alice Bob Carol”， 
则 打印 “Hi Carol，Bob，and Alice”。 


1.2 ”内置 数据 类 型 


使 用 Java 编程 时 ， 必 须 注 意 程序 正在 处 理 的 数据 类 型 。1:1 节 中 的 程序 处 理 的 是 字符 串 
数据 ， 本 节 中 的 许多 程序 主要 处 理 数字 数据 ， 我 们 在 本 书后 面 将 会 研究 更 多 其 他 的 数据 类 
型 。 了 人 解 各 种 数据 类 型 之 间 的 区 别 是 非常 重要 的 ， 因 此 我 们 必须 给 出 数据 类 型 的 准确 定义 : 
数据 类 型 ( data type) 是 值 和 对 这 些 值 的 操作 的 集合 。 例 如 你 熟悉 的 数字 数据 ， 如 整数 和 实 
数 ， 以 及 对 这 些 值 的 操作 ， 如 加 法 和 乘法 。 在 数学 中 ,我 们 学 习 到 数字 的 集合 是 无 限 的 ; 在 
计算 机 程序 中 ， 我 们 能 够 处 理 的 集合 都 是 有 限 的 。 我 们 在 这 些 集合 上 定义 的 操作 也 只 是 针对 
集合 中 有 限 个 数 的 相关 数据 而 设计 的 。 

Java 中 有 八 种 基本 ( primitive) 数据 类 型 ， 大 多 用 于 表示 不 同类 型 的 数字 ， 我 们 最 常 使 
用 的 有 : int 表示 整数 ，double 表示 实数 ，boolean 表示 真 / 假 值 。Java 库 中 还 包含 其 他 的 数 
据 类 型 ， 如 1.1 节 中 的 程序 使 用 String 类 型 表示 字符 串 。 对 于 Java 输入 和 输出 来 说 ，String 
类 型 较为 特殊 ， 它 具有 基本 类 型 的 一 些 特 征 ， 它 的 一 些 操作 被 内 置 在 Java 语言 中 。 为 了 清 
楚 起 见 ， 我 们 将 基本 类 型 和 String 类 型 统称 为 内 置 ( built-in) 类 型 。 在 本 章 中 ,我们 只 关注 
基于 内 置 类 型 计算 的 程序 。 稍 后 ， 我 们 将 学 习 Java 库 中 的 其 他 数据 类 型 并 构建 自己 的 数据 
类 型 。 事 实 上 ，Java 编程 工作 通常 集中 在 构建 数据 类 型 上 ， 我 们 将 在 第 ,3 章 中 详细 讨论 。 

在 定义 基本 术语 之 后 ,我 们 下 面 研究 几 个 示例 程序 和 代码 片段 ， 这 些 程序 展示 了 不 同类 
型 的 数据 的 使 用 。 这 些 代码 片段 并 没有 做 太 多 实际 的 计算 ,但 是 很 快 你 就 会 看 到 基于 这 些 代 
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码 片 段 写 出 的 更 长 、 更 复杂 的 程序 代码 。 了 解数 据 类 型 (包括 它们 的 值 和 操作 ) 是 开始 编程 
的 重要 步 又 ， 它 为 我 们 在 下 一 节 开 始 处 理 更 复杂 的 程序 做 了 铺垫 。 本 节 中 出 现 的 代码 片段 在 
你 以 后 的 编程 工作 中 会 经 常用 到 。 








类 型 值 的 集合 常用 操作 符 实例 
int 整数 二 一 水 /% 99 12 2147483647 
double 浮 点 数 + 一 六 7 3.14 2.5 6.022e23 
boolean 布尔 值 && || ! true false 
char 字符 让 
String 字符 串 + "AB" "Hello" "2.5" 
基本 内 置 数据 类 型 


术语 要 谈论 数据 类 型 ,我 们 需要 介绍 一 些 术 语 。 如 下 代码 片段 : 

Mt "Wr 

a = 1234; 

b = 99; 

c=a+b; 

第 一 行 是 一 个 声明 语句 ( declaration statement)， 它 使 用 标识 符 (identifier)a、b 和 
c 声 明 三 个 变量 (variable)， 其 数据 类 型 为 int。 接 下 来 的 三 行 是 赋值 语句 (assignment 
statement)， 用 文字 常量 (literal) 1234 和 99 以 及 表达 式 ( expression) atb 来 更 改变 量 的 值 ， 
最 终 c 的 值 为 1333。 

文字 常量 (literal)。 文 字 常 量 用 于 在 Java 代码 中 表示 数据 类 型 的 值 。 比 如 1234 或 99 
等 数字 表示 的 是 int 类 型 的 值 ; 添加 一 个 小 数 点 后 ， 如 3.14159 或 2.71828， 表 示 的 是 double 
类 型 的 值 ; 我 们 使 用 关键 字 true 或 false 表示 boolean 类 型 的 值 (这 种 类 型 只 有 这 两 个 值 ) ; 
使 用 一 对 引号 中 包含 的 字符 序列 ， 如 “Hello,World”， 来 表示 String 类 型 的 值 。 

运算 符 (operator)。 运 算 符 用 于 在 Java 代码 中 表示 数据 类 型 之 间 的 操作 。 例 如 ，Java 
使 用 “+” 和 “*” 表 示 整 数 及 浮 点 数 的 加 法 和 乘法 ; Java 使 用 &&、|| 和 ! 代表 布尔 运算 等 。 
我 们 将 在 本 节 后 面 介绍 内 置 类 型 中 最 常用 的 运算 符 。 

标识 符 ( identifier)。 标 识 符 用 于 在 Java 代码 中 表示 各 类 元 素 的 名 称 ， 如 变量 、 类 、 方 

法 等 。 标 识 符 是 由 一 系列 字母 、 数 字 、 下 划 线 和 货币 符号 ($) 构成 的 ， 其 中 第 一 个 字符 不 可 

以 是 数字 。 例 如 ，abc、Ab$、abc123 和 a_b 都 是 合法 的 Java 标识 符 , 但 Ab*、1abc 和 a+b 
不 是 。 标 识 符 区 分 大 小 写 ， 所 以 Ab、ab 和 AB 是 不 同 的 标识 符 名 称 。 特 定 保留 字 如 public、 
static、int、double 、String 、true 、false 和 null 等 ， 不 能 用 作 标 识 符 。 

变量 (variable)。 交 量 是 保存 数据 类 型 值 的 载体 。 在 Java 中 ， 每 个 变量 都 有 一 个 特定 类 
型 ， 并 存储 该 类 型 可 能 的 值 。 例 如 ，int 变量 可 以 存储 值 99 或 1234,， 但 不 能 存储 3.14159 或 
“Hello，World”。 相 同类 型 的 不 同 变量 可 能 存储 相同 的 值 。 另 外 ， 顾 名 思 义 ， 变 量 的 值 可 能 
随 着 计算 的 展开 而 改变 。 例 如 ， 我 们 在 本 书 的 程序 中 使 用 一 个 名 为 sum 的 变量 来 保存 一 系 
列 数字 的 总 和 ， 并 且 随 着 程序 运行 不 断 累 加 。 我 们 使 用 声明 语句 创建 变量 ， 并 用 表达 式 计 算 
变量 ， 后 面 我 们 会 详细 解释 相关 概念 。 

声明 语句 〈declaration statement)。 要 在 Java 中 创建 变量 ,需要 使 用 一 个 声明 语句 ， 简 
称 声明 。 一 个 声明 语句 包括 一 个 数据 类 型 ， 后 跟 一 个 变量 名 。 处 理 声明 语句 时 ，Java 会 在 内 
存 中 预 留用 于 存储 指定 类 型 的 数据 的 内 存 区域 ， 并 将 变量 名 称 与 该 内 存 区 域 相关 联 ， 以 便 在 
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以 后 的 代码 中 使 用 变量 可 以 访问 到 该 值 。 为 简单 起 见 ，Java 支持 在 一 个 声明 语句 中 声明 同一 
类 型 的 多 个 变量 。 

变量 命名 规则 (variable naming convention)。 程 序 员 通常 依照 约定 “数据 类 型 ” 变量 名 
俗 成 的 规则 来 命名 变量 。 在 本 书 中 ,我 们 的 命名 规则 是 ， 每 个 变量 名 
由 一 个 小 写字 母 开始 ， 后 面 可 以 有 若干 个 小 写字 母 、 大 写字 母 或 者 数 
字 ， 而 且 变 量 的 名 称 要 有 具体 的 含义 。 当 一 个 变量 名 是 由 多 个 单词 构成 
时 ， 每 个 单词 的 首 字母 需要 大 写 。 例 如 ; i x、y、sum、isLeapYear 入 呈 中 条 
outDegrees 等 。 程 序 员 将 此 命名 方式 称 为 骆驼 命名 法 (camel case)。 人 

常数 变量 ( constant variable)。 常 数 变量 (简称 常量 ) 这 个 词 看 起 来 有 点 前 后 矛盾 ， 我 
们 用 它 来 描述 在 执行 程序 过 程 中 不 会 发 生 改 变 的 变量 (或 者 说 在 程序 的 每 一 次 执行 期 间 它 的 
值 都 一 样 ) 。 在 本 书 中 ， 常 数 变量 的 名 称 通常 由 大 写字 母 、 数 字 和 下 划 线 组 成 ， 而 且 第 一 个 
字符 需要 是 大 写字 母 。 例 如 ，SPEED OF_LIGHT 和 DARK RED。 

表达 式 (expression)。 表 达 式 是 由 文字 常量 、 变 量 和 操作 组 成 的 。Java 能 够 识别 表达 式 
并 能 够 计算 (evaluate) 它们 的 结果 。 对 于 基本 数据 类 型 ， 表 达 式 通常 看 起 来 就 像 数 学 公式 ， 
使 用 运算 符 指定 要 对 一 个 或 多 个 操作 数 执行 的 数据 操作 。 我 们 使 用 的 大 多 数 运算 符 是 二 元 运 
算 符 ， 它 们 只 需要 两 个 操作 数 ， 例如 x-3 或 5*x。 每 个 操作 数 可 以 是 任意 表达 式 ， 也 可 以 包 
含 插 号 。 例 如 ,我 们 可 以 写 4*(x-3) 或 者 5*x-6,Java 会 明白 我 们 的 意思 。 表 达 式 表示 一 系 
列 将 要 被 执行 的 操作 ,代表 的 是 这 一 系列 运算 之 后 得 到 的 结果 。 

运算 顺序 ( operator precedence)。 表 达 式 中 可 能 包含 多 个 运算 符 ， 那 ” ”操作 数 
么 此 时 应 该 按 什么 顺序 进行 运算 ? Java 中 定义 了 一 套 返 算 符 的 优先 级 规 re a 
则 ， 能 够 清晰 地 定义 运算 的 顺序 ， 并 且 使 用 起 来 非常 自然 。 对 于 算术 运 
算 ， 在 加 法 和 减法 之 前 先 执行 乘法 和 除法 ， 因 此 a-b*e 和 a_(b*c) 表示 相思 和 C= 
同 的 操作 顺序 。 当 算术 运算 符 具有 相同 的 优先 级 时 ， 考 虑 运算 符 的 左 结 ”操作 符 
合 性 (left associativity) 以 确定 运算 顺序 ， 因 此 a-b-c 和 (a-b)-c 表示 相 表达 式 解析 
同 的 操作 顺序 。 如 果 想 要 改变 顺序 的 话 ， 可 以 使 用 括号 来 改变 规则 ， 所 以 对 于 上 面 的 式 子 ， 
如 果 想 先 计算 b-c， 那 么 你 需要 写成 a-(b-c)。 你 将 来 可 能 会 遇 到 一 些 巧妙 使 用 优先 级 规则 
的 Java 代码 ， 但 是 我 们 在 本 书 中 尽量 避免 使 用 这 种 代码 ， 对 于 复杂 的 运算 式 我 们 会 使 用 括 
号 来 标识 运算 顺序 。 如 果 你 对 这 部 分 内 容 感 兴趣 ， 可 以 在 本 书 官网 上 找到 关于 优先 级 规则 
的 详细 解读 。 

赋值 语句 (assignment statement)。 赋 值 语句 用 于 将 数据 值 与 变量 关联 起 来 。 当 我 们 在 
Java 中 编写 c=atb 时 ， 我们 表示 的 并 不 是 一 个 数学 等 式 ， 这 个 语句 表示 一 个 操作 ( action): 
将 变量 e 的 值 设置 为 变量 a 加 变量 b。 确 实 ， 从 数学 角度 分 析 ， 在 执行 赋值 语句 之 后 c 的 值 
与 atb 的 值 是 相等 的 ,但 是 赋值 语句 的 目的 不 是 比较 ， 而 是 要 改变 (或 初始 化 ) c 的 值 。 赋 


值 语句 的 左 侧 必 须 是 单个 变量 ， 右 侧 可 以 是 产生 数值 的 任 声明 语句 

意 表达 式 ， 同 时 ,赋值 语句 两 端的 数据 类 型 必须 是 兼容 ”过 最 各 。 [T5565] 文字 常量 
的 。 所 以 ,，“1234=a;” 和 “a+b=b+a ; ”都 是 Java 中 的 无 a -Fl; 

效 语句 。 这 里 需要 强调 的 是 ， 这 里 等 号 (=) 的 含义 与 数 峰值 语句 一 =b = 99; 

学 方程 式 中 的 不 同 。 


pg 
内 联 初始 化 (inline initialization)。 在 表达 式 中 使 用 内 联 初 始 化 语句 
变量 之 前 ， 必 须 首先 声明 变量 并 为 其 指定 初始 值 ， 否 则 使 用 基本 数据 类 型 
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会 导致 编译 时 错误 。 为 了 使 编程 简单 ， 可 以 将 声明 语句 与 赋值 语句 组 合 在 一 起 ， 这 样 的 语句 
称 为 内 联 初始 化 语句 ( inline initialization statement)。 例 如 ， 以 下 代码 声明 两 个 变量 a 和 bb， 
并 分 别 将 它们 初始 化 为 值 1234 和 99: 


int -a =-1234; 
int :b's:99; 


通常 ， 我 们 在 程序 中 首次 使 用 某 个 变量 时 ， 即 声明 并 初始 化 这 个 变量 。 

跟踪 变量 值 的 变化 。 为 了 检验 你 是 否 完全 理解 了 赋值 语句 的 使 用 方法 ， 请 尝试 理解 以 下 
代码 。 注 意 这 段 代 码 的 意思 是 交换 a 和 b 的 值 (假设 a 和 b 是 int 变量 ): 

int t= a; 

为 了 分 析 这 个 过 程 ， 我 们 可 以 建立 一 张 跟踪 表 ( trace)， 人 研究 每 个 语句 之 后 的 变量 值 的 
变化 。 这 个 方法 也 是 检验 程序 最 可 靠 的 办 法 。 

类 型 安全 (type safety)。Java 需要 你 明确 每 个 变量 的 类 a 写 de EE : 
型 ， 这 样 ，Java 就 能 够 在 编译 时 发 现 类 型 不 匹配 造成 的 错误 ，a -= 1234; ”1234 ”未 定义 
并 提醒 程序 中 的 潜在 漏洞 。 例 如 ; 你 不 能 将 double 值 赋值 给 b = 99; 1234 99 
int 变量 ， 不 能 将 String 类 型 与 布尔 值 相 乘 ， 也 不 能 在 表达 式 "69 50 934 
中 使 用 未 初始 化 的 变量 。 这 种 情况 类 似 于 在 科学 计算 中 , 需 b = ti 99 1234 1234 
要 确保 参与 运算 的 数值 的 单位 是 匹配 的 (例如 ， 将 以 英寸 9 为 你 的 第 一 张 变量 跟踪 表 
单位 的 数值 与 以 磅 9 为 单位 的 数值 相 加 是 没有 意义 的 )。 

接 下 来 ,我 们 将 介绍 最 常 使 用 的 基本 内 置 类 型 (字符 串 、 整 数 、 浮 点 数 和 真 / 假 值 ) 的 
详细 信息 ， 并 通过 示例 代码 说 明 它 们 的 使 用 方法 。 要 了 解 如 何 使 用 数据 类 型 ， 你 不 仅 需要 了 
解 这 些 类 型 能 够 表示 的 数值 集合 ， 还 需要 了 解 这 些 类 型 的 变量 可 以 执行 的 操作 、 调用 这 些 操 
作 的 语言 机 制 以 及 这 些 类 型 的 文字 常量 的 使 用 规则 。 

字符 和 字符 串 。” 字符 (char) 类 型 表示 单个 字母 、 数 字 字 符 或 者 符号 ， 就 像 我 们 日 常 使 
用 计算 机 时 输入 的 那些 字符 一 样 。 字 符 类 型 值 最 多 可 以 有 2“ 种 ,我 们 常用 的 有 字母 、 数 
字 、 符 号 和 空白 字符 (如 制 表 符 tab 和 换行 符 )。 可 以 通过 在 一 对 单 引 号 内 包含 一 个 字符 来 
指定 字符 类 型 的 文字 常量 ， 例 如 ，'a' 代表 字母 a。 对 于 制 表 符 、 换 行 符 、 反 和 斜 线 、 单 引号 和 
双 引 号 ， 我 们 需要 使 用 特殊 的 转 义 符 (escape sequence) 来 表示 ， 分 别 是 tt、m、N、 YX 和， 
这 些 字符 使 用 16 位 整数 表示 ， 编 码 的 方式 称 为 Unicode。 除 了 常见 的 字符 外 ， 还 有 一 些 转 
义 符 用 于 表示 键盘 上 找 不 到 的 特殊 字符 (请 参阅 本 书 官网 以 找到 详细 内 容 )。 对 于 字符 型 变 
量 , 我 们 通常 只 进行 赋值 操作 一般 不 会 执行 其 他 操作 。 

字符 串 (String) 类 型 表示 一 个 字符 序列 。 可 以 通过 在 一 对 双 引 号 内 包含 一 个 字符 序列 
来 指定 字符 串 类 型 的 文字 常量 (例如 "Hello，World")。String 数 ee 
据 类 型 不 是 基本 类 型 ， 但 Java 有 时 会 把 它 当 成 基本 数据 类 型 a 例 l 人 
如 ， 对 于 字符 串 类 型 而 言 ， 连 接 符 《+) 表示 的 是 连接 操作 ， 操 作 ”文字 常量 An' 
数 是 两 个 字符 串 ， 运 算 的 结果 是 将 第 二 个 操作 数 的 字符 附加 到 第 ”Java 内置 的 char 数据 类 型 
一 个 操作 数 的 字符 后 面 而 形成 一 个 新 的 字符 串 类 型 变量 。 


日 英寸 是 长 度 单位 ，1 英寸 = 0.0254 米 。 一 一 编辑 注 
日 磅 是 质量 单位 ，1 磅 约 等 于 0.45 公斤 。 一 一 编辑 注 
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通过 定义 String 变量 并 在 表达 式 和 赋值 语句 中 使 用 ， 连 接 操 作 可 以 完成 一 些 特殊 的 
计算 任务 。 例 如 ，Ruler (程序 1.2.1) 计算 二 个 标尺 函数 (ruler 
function) 值 的 表格 ,该 函数 描述 了 标尺 刻度 标记 的 相对 长 度 。 从 ”从 字符 序列 
中 可 以 看 出 ， 编 写 一 个 简短 的 程序 以 产生 大 量 输出 是 很 容易 的 。 ”中型 “| hello，world' 
按照 代码 的 规律 对 它 进行 简单 的 扩展 ， 打 印 出 第 5 行 、 第 6 行 、 文字 常量 Et 


第 7 行 等 ， 你 可 以 看 到 每 次 向 该 程序 添加 两 个 语句 时 ， 输 出 的 字 ”运算 连接 
符 数 量 将 会 加 倍 。 具 体 来 说 ， 如 果 程 序 打印 4 行 , 第 n 行 将 包含 ”运算 符 + 


2"-1 个 数字 。 也 就 是 说 ， 如 果 要 以 这 种 方式 继续 添加 语句 ， 当 程 ”Java 的 内 置 字符 串 数据 类 型 
序 打印 30 行 时 ， 会 打印 超过 10 亿 个 数字 。 


表达 式 值 
"Hi, " + "Bob" "Hi, Bob" 
Vd 2 
"1234" + " + "+ "99" "1234 + 99" 
"1234" + "99" "123499" 
典型 字符 串 表 达 式 


程序 1.2.1 字符 串 连 接 
public class Ruler 
public static void main(String[] args) 


String rulerl = "1"; 

String ruler2 = rulerl + ”2 " + rulerl; 
String ruler3 = ruler2 + "3" + ruler2; 
String ruler4 = ruler3 + " 4 " + ruler3; 
System.out.printlnCruler1); 
System.out.printlnCruler2); 
System.out.printlnCruler3) ; 
System.out.printlnCruler4) ; 

全 
} 


该 程序 打印 出 标尺 上 每 一 个 刻度 的 相对 长 度 。 第 " 行 输出 表示 的 是 以 过 英寸 


为 最 汰 刻度 标尺 上 每 个 标记 的 相对 长 度 。 例 如 ， 第 4 行 输 出 给 出 了 刻度 是 英寸 
的 标尺 上 刻度 间隔 标记 的 相对 长 度 。 


avac Ruler .java 
ava Ruler 


A 2 





到 目前 为 止 ， 我们 最 常 使 用 连接 操作 的 地 方 是 在 System.out.println() 函数 中 ， 将 计算 
结果 与 其 他 信息 输出 结合 在 一 起 。 例 如 ， 我 们 可 以 简化 UseArgument (程序 1.1.2 )， 将 它 的 
main() 函数 中 的 三 个 语句 替换 为 如 下 单个 语句 : 


System.out.printlnC"Hi，”"”+ args[0] + ". How are you?"); 


我 们 首先 详细 地 介绍 了 String 类 型 ， 因 为 在 程序 中 ， 无 论 我 们 处 理 的 数据 类 型 是 什么 ， 
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都 需要 在 输出 (和 命令 行 参数 ) 中 将 结果 转化 成 String 类 型 。 接 下 来 ,我 们 介绍 在 Java 中 如 
何 将 数字 转换 为 字符 串 ， 以 及 如 何 将 字符 串 转换 为 数字 。 

将 数字 转换 为 字符 串 进行 输出 。 如 本 节 开 头 所 述 ，Java 内 置 的 String 类 型 有 一 些 特殊 的 
使 用 方法 。 其 中 一 个 特殊 使 用 方法 即 你 可 以 轻松 地 将 任何 类 型 的 值 转换 为 String 类 型 值 : 每 
当 我 们 使 用 “ +” 运算 符 时 ， 如 果 其 中 一 个 操作 数 是 String 类 型 ，Java 会 自动 将 另 一 个 操作 
数 也 转换 为 String 类 型 ， 从 而 产生 一 个 新 的 字符 串 ， 这 个 字符 串 中 包含 了 第 一 个 操作 数 的 所 
有 字符 ， 后跟 第 二 个 操作 数 的 字符 。 例 如 ， 以 下 两 个 代码 片段 的 结果 : 


String a=?34 3 String a = "1234"; 
String b = "99"; int b = 99; 
String Cc =a+b; String Cc =a+b; 


都 是 一 样 的 : 它们 都 会 使 被 赋值 为 “123499”。 我 们 使 用 这 种 自动 转换 来 形成 一 些 String 类 
型 的 值 ， 并 用 在 System.out.print() 和 System.out.println() 中 。 例 如 ， 我 们 可 以 写 出 如 下 语句 : 


System.out.printin(a + "+ "+b+"=" + CO); 


如 果 a、b 和 c 分 别 是 值 为 1234、99 和 1333 的 int 型 变量 ,那么 此 语句 打印 字符 串 “1234+99= 
1333°% 

将 字符 串 转 换 为 输入 数字 。Java 还 可 以 将 我 们 输入 为 命令 行 参数 的 字符 串 转 换 为 基本 
类 型 的 数值 。 为 此 ， 我 们 使 用 Java 库 函 数 Integer.parseInt() 和 Double.parseDouble()。 例 如 ， 
在 程序 文本 中 输入 Integer.parseInt ("123") 等 效 于 输入 整数 123。 如 果 用 户 键入 123 作为 第 
一 个 命令 行 参数 ， 那 么 代码 Integer.parseInt ( args [0]) 将 字符 串 值 "123" 转换 为 int 值 123。 
在 本 节 的 程序 中 将 会 看 到 这 种 用 法 的 几 个 示例 。 

通过 这 些 机 制 ， 我 们 仍然 可 以 将 每 个 Java 程序 视 为 一 个 转化 箱 ， 它 接受 字符 串 参 数 并 
产生 字符 串 结果 ,但 是 现在 我 们 可 以 将 这 些 字符 串 看 作 数 字 ， 并 对 它们 进行 一 些 计 算 。 

整数 int 类 型 用 于 表示 整数 (自然数 )， 它 的 取 值 范围 在 -2147483648 ( -2”) 和 
2147483647 (2 -1 ) 之 间 。 之 所 以 存在 这 样 的 界限 ， 是 因为 整数 是 以 32 位 二 进 制 数 (binary 
digit) 表示 的 ， 即 整数 类 型 变量 有 2” 个 可 能 的 值 (术语 三 进 制 数 在 计算 机 科学 中 使 用 非常 
广泛 ， 我们 常常 简称 之 为 比特 (bit): 一 个 比特 的 值 只 能 是 0 或 1)。int 值 的 取 值 范围 是 不 对 
称 的 ， 因 为 0 包含 在 正 值 中 。 你 可 以 在 本 节 未 尾 的 问答 环节 看 到 更 多 、 更 详细 的 有 关 数 字 表 
示 的 信息 ， 但 在 当前 的 上 下 文中 ， 你 只 需要 理解 int 的 取 值 是 有 限 的 ， 只 能 是 刚刚 给 出 的 范 
围 内 的 一 个 值 。 可 以 使 用 十 进 制 数字 0 一 9 的 序列 指定 一 个 int 文字 常量 (这样 的 文字 常量 会 
被 解释 为 十 进 制 数 ， 而 且 它 表示 的 值 应 落 在 定义 的 范围 内 )。 我 们 经 常 使 用 int 型 变量 ， 当 我 
们 编写 程序 时 ， 自 然而 然 地 就 会 用 到 它们 。 


表达 式 值 说 明 
99 99 整数 型 文字 常量 
+99 99 正 号 
-99 -99 负 号 
5+3 8 加 法 
S=3 2 减法 
5*3 15 乘法 
513 1 取 整 除法 ? 
5%3 作 余数 
1/0 运行 时 错误 


典型 的 int 表达 式 
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表达 式 值 说 明 
ey 13 “#” 优 先 级 更 高 
3+5/2 5 “/” 优 先 级 更 高 
3-5-2 -4 左 结合 
(3-5)-2 -4 优化 后 的 书写 方式 
3-(5-2) 0 消除 歧义 的 写法 


典型 的 int 表达 式 ( 续 ) 
@ 只 计 商 ,不 计 余 数 的 除法 。 一 一 译 者 注 


Java 中 内 置 了 用 于 int 数 据 类 型 的 加 / 减 (+ 和 一 )、 乘 法 (*)、 除 法 (/) 和 求 余 (%) 的 
标准 算术 运算 符 。 这 些 运算 符 需要 两 个 int 型 变量 做 操作 数 ， 并 产生 一 个 int 型 结果 ， 需 要 
注意 的 是 ， 除 法 或 求 余 操 作 的 除数 不 可 以 为 0。 这 些 操 作 的 定义 和 初等 教育 的 数学 课堂 上 的 
定义 是 一 致 的 ， 只 是 请 记 住所 有 结果 必须 是 整数 : 给 定 两 个 int 值 a 和 b，a/b 的 值 是 a 除 以 
b 之 后 运算 的 整数 部 分 ， 忽 略 余数 值 ; a%b :的 值 是 将 a 除 以 b 后 获得 的 余数 值 。 例如 ，17/3 
的 值 为 5，17%3 的 值 为 2。 我们 从 算术 运算 得 到 的 int 结果 与 我 们 在 数学 课堂 上 学 到 的 一 样 ， 
除非 结果 的 值 太 大 ， 超 出 了 int 的 32 位 表示 法 ， 那 么 它 将 以 明确 的 方式 被 截断 ， 只 保留 32 
位 。 这 种 情况 被 称 为 溢出 (overflow)。 一般 来 说 ,我 们 必须 小 心 ， 以 确保 溢出 不 会 使 得 我 们 
的 代码 产生 错误 的 结果 。 目 前 ， 我 们 将 以 较 小 数值 进行 计算 ,所 以 你 不 必 担 心 这 些 问题 。 


取 值 范围 -23 到 23!-1 之 间 的 整数 

典型 文字 常量 1234 99 0~ 1000000 
运算 符号 加 法 减法 乘法 除法 求 余数 
运算 符 + 一 十 = 人 % 
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程序 1.2.2 ”整数 的 乘法 与 除法 







public class Int0ps 







public static void main(String[] args) 
{ 





int a = Integer.parseInt(args[0]); 
int b = Integer.parseInt(args[1]); 
int ps ab; 
int qg=a/b; 
int r = a % b; 










System.out.printin(a+ "* "+b+"=" +p); 
System.out.println(a + "/"+b+"= "+q); 
System.out.println(a + "%"+b+"="+r) 
System.out.printin(a + "= "+q+"* 










整数 的 运算 内 置 于 Java 中 。 这 个 程序 的 大 部 分 代码 都 是 用 来 输入 和 输出 的 ， 
实际 算术 操作 即 程 序 中 部 的 几 个 简单 语 甸 ， 它 们 会 完成 计算 并 将 值 分 别 赋 给 
P、9 和 r。 















% javac IntOps.java 
% java IntOps 1234 99 
1234 * 99 = 122166 
1234 / 99 = 12 
1234 % 99 = 46 
1234 = 12 * 99 + 46 
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程序 1.2.2 展示 了 整数 的 三 种 基本 运算 (乘法 、 除 法 和 求 余 )。 它 还 演示 了 使 用 Integer. 
parseInt() 将 命令 行 上 的 String 值 转换 为 int 值 ， 以 及 使 用 自动 类 型 转换 将 int 值 转换 为 
String 值 。 

另外 还 有 三 种 内 置 类 型 ， 它 们 在 Java 中 也 表示 整数 ， 只 是 存储 的 形式 不 同 。long、 
short 和 byte 类 型 的 用 法 与 int 类 型 相同 ， 只 是 它们 分 别 使 用 64 位、16 位 和 8 位 的 二 进 制 
数 表 示 整 数 ， 因 此 它们 的 取 值 范围 是 不 同 的 。 程 序 员 在 处 理 巨 大 的 整数 时 应 使 用 long 类 型 ， 
而 使 用 其 余 类 型 可 节省 空间 。 你 可 以 在 本 书 官网 上 找到 关于 每 种 类 型 的 最 大 值 和 最 小 值 ， 也 
可 以 根据 位 数 自行 计算 出 取 值 范围 。 

浮 点 数 double 类 型 代表 浮 点 数 ， 经 常 应 用 于 科学 和 商业 计算 中 。 浮 点 数 在 计算 机 内 部 
的 表示 方法 类 似 科 学 计数 法 ， 所 以 它 的 取 值 范围 很 大 。 我 们 常常 使 用 浮 点 数 来 表示 实数 ， 但 
是 需要 注意 它们 与 实数 不 一 样 ! 实数 的 个 数 有 无 数 个 ， 但 是 我 们 在 任何 计算 机 中 都 只 能 表示 
有 限 数量 的 浮 点 数 。 浮 点 数 确 实 已 经 能 够 很 好 地 逼近 实数 ， 所 以 通常 情况 下 我 们 都 可 以 在 应 
用 程序 中 使 用 它们 ， 但 是 需要 注意 一 些 特殊 的 情况 : 用 浮 点 数 运算 时 可 能 会 产生 精度 不 够 的 
问题 。 


表达 式 值 
3.14Y + 2.0 5.141 
3.141 - 2.0 1.111 
3.141 / 2.0 1.5705 
5.0 / 3.0 1.6666666666666667 
10.0 % 3.141 0.577 
10 "00 Infinity 
Math.sqrt(2.0) 1.4142135623730951 
Math.sqrt(-1.0) NaN 
典型 的 double 表达 式 


double 类 型 的 文字 常量 可 以 用 一 个 带 有 小 数 点 的 数字 序列 来 表示 。 例 如 ，3.14159 就 是 
一 个 double 类 型 的 文字 常量 ， 表 示 7 的 六 位 数 近似 值 。 也 可 以 使 用 类 似 科学 计数 法 的 方式 
指定 double 类 型 的 文字 常量 : 6.022e23 表示 数字 6.022X 10”。 与 整数 一 样 ， 你 可 以 按照 这 
些 规 则 在 编程 时 键 人 浮 点 数 的 文字 常量 ,或 者 将 浮 点 数 以 字符 串 的 形式 当 作 命 令 行 参数 输入 
给 程序 。 

Java 同样 为 double 类 型 定义 了 算术 运算 符 +、-、* 和 /对 应 的 操作 ， 与 数学 课本 上 的 
定义 方式 保持 一 致 。 除 了 这 些 内 置 运算 符 之 外 ，Java 的 Math 库 中 还 定义 了 平方 根 函 数 、 三 
角 函 数 、 对 数 /指数 函 数 以 及 浮 点 数 的 其 他 常用 函数 。 要 在 表达 式 中 使 用 这 些 函 数 时 ， 你 可 
以 直接 键入 函数 的 名 称 和 括号 中 的 参数 。 例 如 ，Math.sqrt(2.0) 表示 的 是 计算 2 的 平方 根 的 
近似 值 ， 该 值 是 一 个 double 型 值 。 我 们 将 在 2.1 节 中 更 详细 地 讨论 这 一 设计 背后 的 机 制 ， 在 
本 节 末 尾 有 更 多 关于 Math 库 的 详细 描述 。 


取 值 范围 实数 (按照 IEEE 754 标 准 定义 ) 

典型 文字 常量 3.14159 6.022e23 2.0 1.4142135623730951 
操作 加 法 减法 乘法 除法 
操作 符 + 多 / 


Java 内 置 的 double 数据 类 型 








程序 12.3 求解 一 元 二 次 方程 








public class Quadratic 







public static void main(String[] args) 
{ 





double b = Double.parseDouble(args[0]); 
double c = Double.parseDouble(args[1]); 
double discriminant = b*b - 4.0*c; 
double d = Math.sqrt(discriminant); 
System.out.printin((-b + d) / 2.0); 
System.out.println((-b - d) / 2.0); 













该 程序 使 用 一 元 二 次 方程 求 根 公式 求解 x*+bx+c， 并 打印 。 例 如 ，x2-3x+2 的 
根 是 1 和 2， 因 为 我 们 可 以 将 方程 式 分 解 为 (x-1) (x-2) ; 忆 -x-1 的 根 是 办 和 
1-， 其 中 是 黄金 分 割 比例 ; 而 w+x+1 的 根 不 是 实数 。 














% java Quadratic -1.0 -1.0 
1.618033988749895 
-0.6180339887498949 

% java Quadratic 1.0 1.0 
NaN 

NaN 


javac Quadratic.java 
ava Quadratic -3.0 2.0 






j 
.0 
.0 






使 用 浮 点 数 时 ， 你 遇 到 的 第 一 件 事 就 是 精度 (precision) 问题 。 例 如 ，5.0/2.0 的 结果 打 
印 出 来 是 2.5， 与 预期 一 样 ， 但 5.0/3.0 的 结果 会 显示 为 1.6666666666666667。 在 1.5 节 中 ， 
我 们 将 学 习 Java 中 对 数字 输出 时 显示 的 有 效 位 数 的 控制 机 制 。 在 此 之 前 ， 我 们 将 使 用 Java 
默认 输出 格式 。 

计算 的 结果 可 能 会 是 Infinity (数字 太 大 而 无 法 表示 ) 或 NaN (计算 结果 未 定义 ) 等 特殊 
值 。 如 果 在 计算 时 考虑 到 这 些 值 ， 则 需要 考虑 大 量 细节 ， 但 在 这 个 阶段 你 可 以 忽略 这 些 复杂 
情形 ， 以 轻松 的 方式 使 用 double 来 编写 Java 程序 ， 用 你 的 程序 代替 计算 器 进行 各 种 计算 。 
例如 ， 程 序 1.2.3 显示 了 使 用 double 类 型 值 和 求 根 公式 计算 二 元 三 次 方程 的 两 个 根 。 本 节 末 
尾 还 有 几 个 类 似 的 练习 。 

与 整数 有 long、short 和 byte 多 种 表示 形式 一 样 ， 实 数 的 另 一 种 表示 形式 称 为 float。 当 
对 数据 的 精度 要 求 不 高 时 ， 程 序 员 有 时 使 用 float 来 节省 空间 。double 类 型 大 约 可 以 保存 15 
位 有 效 数字 ， 而 float 型 仅 适用 于 7 位 有 效 数 字 的 情况 。 本 书 中 不 使 用 float 类 型 。 

布尔 型 boolean 型 表示 逻辑 上 的 真 假 ， 它 只 可 能 有 两 个 值 : true 和 false， 这 两 个 值 也 
是 该 类 型 的 两 个 文字 常量 。 每 个 布尔 运算 的 操作 数 都 需要 是 布 
尔 类 型 ， 运 算 的 结果 仍然 是 一 个 布尔 值 ， 即 只 能 取 true 和 false 
这 两 个 值 之 一 。 布 尔 类 型 的 运算 非常 简单 ， 但 是 这 些 数据 和 运 


值 true 或 false 
文字 常量 true false 


算是 计算 机 科学 的 基础 。 ws a 
为 布尔 定义 的 最 重要 的 操作 是 与 (&&)、 或 (||)、 非 (!)， 到 各 了 
其 定义 为 : Java 内 置 的 布尔 数据 类 型 


。 如 果 两 个 操作 数 都 为 tue， 则 a &&b 为 true; 如 果 两 者 中 任意 一 者 值 为 false， 则 为 false。 
。 如 果 两 个 操作 数 都 为 false， 则 allb 为 false; 如 果 两 者 任意 一 者 值 为 true， 则 为 true。 





。 如 果 a 是 false， 则 !a 是 true; 如 果 a 为 true， 则 !a 为 false。 

为 了 使 这 些 定义 更 直观 ， 我 们 通常 使 用 一 种 称 为 真 值 表 (truth table) 的 表格 ， 对 每 个 运 
算 的 每 种 可 能 性 进行 全 面 说 明 。not 函数 只 有 一 个 操作 数 ， 操 作 数 的 两 个 可 能 值 对 应 的 每 一 
个 值 均 在 第 二 列 中 指定 。and 和 or 函数 都 有 两 个 操作 数 ， 操 作 数 值 有 四 种 不 同 的 情况 ， 每 种 
可 能 情况 的 函数 值 在 右边 两 列 指定 。 











a la a b 
true false false false false false 
false true false true false true 
true false false true 
true true true true 
布尔 运算 的 真 值 表 定义 


这 些 运 算 符 与 括号 相配 合 ， 可 以 形成 更 复杂 的 表达 式 ， 用 于 表示 复杂 的 布尔 函数 。 相 同 的 
功能 也 可 以 用 不 同形 式 的 表达 式 来 表示 。 例 如 ， 表 达 式 (a && b) 和 ! (!all'b) 是 等 价 的 。 





Ei b a && b la !b ta bl Lb CT 
false false false true true true false 
false true false true false true false 
true false false false true true. false 
true true true false false false true 


从 真 值 表 中 可 以 看 到 a&&b 和 ! (!4a ||1bp) 是 等 价 的 


操纵 这 类 表达 式 的 研究 被 称 为 布尔 逻辑 (Boolean logic)。 它 是 数学 的 一 个 分 支 领域 ， 也 
是 计算 机 运算 的 基础 ， 它 在 计算 机 硬件 的 设计 和 操作 中 起 着 至 关 重 要 的 作用 ， 也 是 计算 机 硬 
件 理 论 基础 的 起 点 。 在 本 书 中 ， 我们 所 研究 的 布尔 表达 式 主要 用 来 控制 程序 的 行为 。 通 常 ， 
我 们 使 用 布尔 表达 式 来 表示 一 个 特定 的 条 件 ， 如 果 该 表达 式 为 真 ， 则 会 执行 一 段 预先 编写 好 
的 程序 代码 语句 ; 如 果 该 表达 式 为 false， 那 么 将 执行 另外 一 段 语句 。 我 们 将 会 在 1.3 节 中 详 
细 介 绍 这 一 机 制 。 

比较 有 一 些 运 算 符 是 混合 类 型 ( mixed-type) 的 ， 它 们 的 操作 数 是 一 种 类 型 ， 而 产生 
的 结果 是 另 一 种 类 型 。 最 重要 的 混合 类 型 运算 符 是 比较 运算 符 , 包括 ==、!=、<、<=、> 和 
， 它 们 的 操作 数 可 以 是 任意 基本 数字 类 型 ， 运 算 后 产生 一 个 布尔 结果 。 因 为 我 们 会 为 每 
一 个 数据 类 型 定义 它们 的 运算 操作 ， 每 个 数据 类 型 都 有 比较 运算 ， 因 此 这 些 符 号 每 一 个 都 代 
表 了 许多 种 操作 ( 即 所 有 类 型 的 比较 操作 都 使 用 这 些 运算 符 。 译 者 注 )。 需 要 说 明 的 是 ， 
比较 操作 要 求 两 个 操作 数 是 相同 的 类 型 。 


判断 结果 是 否 为 负 什 


= 





(b*b = 4.0*a*c) >= 0.0 
判断 是 否 是 一 个 世纪 的 开始 (year % 100) == 0 
判断 是 否 是 合法 月 份 (month >= 1) && (month <= 12) 
典型 的 比较 表达 式 


即使 没有 深入 了 解数 值 存 储 和 表示 的 细节 ， 但 很 明显 ， 各 种 类 型 数据 的 操作 是 完全 不 
同 的 。 例 如 ， 比 较 两 个 int 型 数字 ， 如 判断 (2<=2 ) 是 否 为 真 ， 这 是 一 种 运算 操作 ; 比较 两 
个 double 型 数字 ， 如 判断 ( 2.0<=0.002e3 ) 是 否 为 真 ， 则 是 另外 一 种 完全 不 同 的 运算 操作 。 
尽管 种 类 繁多 ， 但 每 种 类 型 的 定义 都 非常 清晰 ， 而 且 可 以 用 它们 来 编写 包含 测试 条 件 ， 如 


编程 元 于 jy 


(b*b-4.0*a*c) >=0.0 的 代码 。 在 以 后 的 编程 中 ， 你 会 经 常用 到 它们 。 

比较 运算 符 比 算术 运算 符 的 优先 级 低 ， 比 布尔 运算 符 的 优先 级 高 ， 因 此 在 刚才 的 例子 
中 ,，(b*b-4.0*a*c) >=0.0 表达 式 并 不 需要 括号 。 而 且 你 也 可 以 写 一 个 不 带 括号 的 表达 式 以 
测试 int 变量 month 的 值 是 否 在 1 到 12 之 间 ， 即 month>=l && month<=12。 不 过 ， 使 用 括 
号 是 更 好 的 代码 书写 习惯 。 

比较 运算 以 及 布尔 逻辑 可 为 Java 程序 中 的 决策 提供 依据 。 程 序 1.2.4 中 展示 了 如 何 使 用 
这 些 运算 符 ， 你 也 可 以 在 本 节 末 尾 的 练习 中 找到 其 他 示例 。 在 1.3 节 中 ， 我 们 将 看 到 如 何在 
更 复杂 的 程序 中 使 用 布尔 表达 式 。 


























库 方法 与 API 


程序 12.4 ”图 年 
public class LeapYear 
{ 


public static void main(String[] args) 


和 
} 


该 程序 测试 输入 的 整数 是 否 是 公历 中 的 闺 年 年 号 :如果 年 号 可 以 被 4 整除 (如 
2004 ) ， 那 么 就 是 闽 年 ; 如 果 还 可 以 被 100 整 除 ; 则 还 需要 被 400 除 尽 才 是 闽 年 
(如 2000 ) ， 否 则 就 不 是 (如 1900 ) 。 


% javac LeapYear .java 
% java LeapYear 2004 
true 

% java LeapYear 1900 
false 

% java LeapYear 2000 
true 


int year = Integer.parseInt(args[0]); 
boolean isLeapYear; 

isLeapYear = (year % 4 == 0); 
isLeapYear = isLeapYear && (year % 100 != 0); 
isLeapYear = isLeapYear || (year % 400 == 0); 
System.out.printin(isLeapYear); 





含义 true false 
等 于 2 == 2 2 == 3 
不 等 于 3 != 2 2-1= 2 
小 于 二 培 .< 
小 于 或 等 于 2 多 3 <= 2 
大 中 13 祝 虽 SA 
大 于 或 等 于 3>= 2 275383 


比较 操作 示例 ( 操作 数 为 int 类 型 ， 结 果 为 布尔 类 型 ) 
正如 我 们 所 看 到 的 ， 许 多 编程 任务 除了 使 用 内 置 运算 符 之 外 ， 还 需要 使 


用 Java 库 方法 。 可 用 的 库 方 法 的 数量 是 巨大 的 。 在 学 习 编 程 的 过 程 中 ,你 将 学 习 使 用 越 来 
越 多 的 库 方法 ,但 在 初学 阶段 最 好 是 将 注意 力 控制 在 相对 较 小 的 范围 内 。 在 本 章 中 ,你 已 


经 使 用 了 一 些 Java 方 法 ， 如 打印 的 方法 、 用 于 将 数据 从 一 种 类 型 转换 为 另 一 种 类 型 的 方法 ， 
以 及 用 于 计算 数学 函数 的 方法 ( Java Math 库 )。 在 后 面 的 章节 中 ， 你 不 仅 会 学 到 如 何 使 用 其 
他 方法 ， 还 可 以 了 解 如 何 创 建 和 使 用 自己 的 方法 。 

为 方便 起 见 ， 我 们 将 使 用 如 下 表格 来 总 结 你 需要 知道 如 何 使 用 的 库 方 法 : 


void System.out.print(String s) 打印 s 
void System.out.println(String s) 打印 s 并 换行 


void System.out.printin() 换行 
注意 ;任何 类 型 的 数据 都 可 以 用 作 参数 ( 并 将 自动 转换 为 Sting 类 型 ) 。 
29 打印 字符 串 到 终端 的 Java 库 方法 


我 们 把 这 样 的 表 叫 作 应 用 程序 编程 接口 (Application Programming Interface, API) 。 在 
API 表 中 ， 每 个 方法 占 一 行 ， 并 描述 了 如 何 使 用 该 方法 的 信息 。 表 中 的 代码 不 是 你 使 用 该 方 
法 的 代码 ， 而 是 方法 的 签名 (signature)。 签 名 指定 了 方法 的 参数 类 型 、 方 法 名 称 和 方法 计算 
结果 (返回 值 ) 的 类 型 。 





在 你 的 代码 中 ， 你 可 以 通过 键入 方法 名 及 其 参数 来 调用 库 名 
该 方法 ， 参 数 写 在 括号 中 ， 用 逗号 分 隔 。 当 Java 执行 你 的 程 狼人 Mp 
序 时 ， 我 们 称 它 使 用 给 定 的 参数 调用 方法 ， 并 且 该 方法 返回 六 法 等 名” ”” 着 名 


一 个 值 。 方 法 调用 是 一 个 表达 式 ， 所 以 你 使 用 方法 调用 时 就 。 愉 

像 使 用 变量 和 文字 常量 来 构建 更 复杂 的 表达 式 一 样 。 例 如 ， Ek TE) 
你 可 以 编写 如 IMath.sin(x)* Math.cos(y) 这 样 的 表达 式 。 参 i 加 多半 类 型 

数 也 可 以 是 一 个 表达 式 ， 所 以 你 可 以 编写 像 Math.sqrt ( b*b- 
4.0*a*c) 这 样 的 表达 式 ，Java 能 够 理解 它 的 意思 一 一 它 会 计 
算 参 数 表达 式 ， 并 将 结果 值 传递 给 方法 。 


库 名 方法 名 


方法 签名 解析 


double d = Math.sqrt(b*b — 4.0*a*c); 
AS 本 ， 
返回 值 类 型 参数 
使 用 库 方 法 


从 随后 的 API 表 中 ， 你 可 以 找到 Java Math 库 中 的 一 些 常 用 方法 ， 也 可 以 看 到 我 们 使 用 
过 的 将 文本 打印 到 终端 窗口 的 方法 ， 以 及 将 字符 串 转换 为 基本 类 型 的 Java 方 法。 下 表 展 示 





了 这 些 库 方 法 的 几 种 调用 示例 。 
方法 调用 库 返回 值 类 型 值 
Integer .parseInt("123") Integer int 123 
Double.parseDouble("1.5") Double double 41. 
Math .sqrt(5.0*5.0 — 4.0*4.0) Math double 3.0 
Math.1log(Math.E) Math double 1.0 
Math.random( ) Math double [0,1) 范围 内 的 一 个 随机 值 
Math.round(3.14159) Math long 3 
Math.max(1.0, 9.0) Math double : 9.0 


典型 的 Java 库 方 法 的 调用 
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public class Math 


double abs(double a) a 的 绝对 值 
double max(double a, double b) 4a 和 中 的 较 大 者 
double min(double a, double b) a 和 4b 中 的 较 小 者 
注 1: int、long 和 float 类 型 数据 也 可 以 使 用 abs()、max() 和 min() 方法。 

double sin(double theta) theta 的 正弦 值 
double cos(double theta) theta 的 余弦 值 
double tan(double theta) theta 的 正切 值 


注 2: 角度 以 弧度 表示 。 使 用 toDegrees() 和 toRadians() 进行 弧度 角度 的 转换 。 
注 3: 使 用 asin()、acos() 和 atan() 计算 反 三 角 函 数 。 


double exp(double a) 指数 操作 ( e? ) 
double log(double a) 自然 对 数 ( log。 a 或 者 In a) 
double pow(double a, double b) 计算 a 的 b 次 究 (a*) 
1ong round(double a) 将 a 向 下 取 整 
double random( ) [0,1) 范围 内 的 一 个 随机 值 
double sqrt(double a) a 的 平方 根 
double E 欧 拉 数 e 的 值 ( 常量 ) 
doubie PI 7 的 值 (常量 ) 
从 本 书 官网 上 可 以 查看 其 他 可 用 的 方法 。 

Java Math 库 中 常用 方法 示例 
void System.out.print(String s) 打印 s 
void System.out.printin(String s) 打印 s 并 换行 
void System.out .printin() 换行 


用 于 将 字符 串 打印 到 终端 的 Java 库 方 法 


int Integer .parseInt(String s) 把 s 转换 为 int 类 型 的 值 
double Double.parseDouble(String s) 把 s 转换 为 double 类 型 的 值 
1ong Long.parseLong(String s) 把 s 转换 为 long 类 型 的 值 


用 于 将 字符 串 转换 为 基本 类 型 的 Java 库 方法 


上 文 提 到 的 方法 基本 都 是 纯 方法 ( pure function) 一 一 给 出 相同 的 参数 ， 它 们 总 是 会 返 
回 相同 的 值 ， 而 且 不 会 产生 任何 可 观察 到 的 副作用 (side effect)。 只 有 三 个 方法 的 情况 不 同 : 
Math.random() 方法 不 是 纯 方法 ， 因 为 每 次 调用 时 它 都 会 返回 一 个 不 同 的 值 ; System.out. 
print() 和 System.out.println(0) 也 不 是 纯 方 法 ， 因 为 它们 产生 副作用 一 一 它们 会 把 字符 串 打印 
到 终端 上 。 和 在 API 中 ， 如 果 一 个 方法 能 够 产生 副作用 ， 我 们 使 用 一 个 动词 短语 来 描述 ; 否 
则 ， 我 们 使 用 一 个 名 词 短 语 来 描述 返回 值 。 关 键 字 void 表示 不 产生 返回 值 的 方法 (其 主要 
目的 是 产生 副作用 )。 

Math 库 还 定义 了 Math.PI (用 于 表示 站 ) 和 Math.E (用 于 表示 e) 两 个 常量 值 ， 可 以 在 
程序 中 直接 使 用 。 例 如 ，Math.sin (Math.PI/ 2 ) 的 值 为 1.0 (Math.sin() 的 参数 是 弧度 制 的 )， 
Math.log (Math.E) 的 值 为 1.0 (Math.logO 是 自然 对 数 函 数 )。 

这 些 API 是 Java 在 线 文档 的 典型 示例 ， 而 在 线 文档 是 现代 编程 中 的 参照 标准 。Java 
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API 有 大 量 的 在 线 文 档 可 供 专业 编程 人 员 使 用 ， 如 果 你 对 它们 感 兴 趣 ， 可 直接 从 Java 网 站 
或 者 通过 本 书 官网 找到 。 你 不 需要 访问 在 线 文 档 来 理解 本 书 中 的 代码 或 编写 类 似 的 代码 ,， 因 
为 我 们 在 文中 介绍 和 解释 了 所 有 用 到 的 这 些 库 方法 ,并且 在 书 未 对 它们 做 了 总 结 。 在 第 2 章 
和 第 3 章 中 ,你 将 了 解 如 何 开发 一 些 供 自己 使 用 的 方法 并 定义 自己 的 API。 

类 型 转换 ”现代 编程 的 主要 规则 之 一 是 你 应 该 始终 了 解 程序 正在 处 理 的 数据 类 型 。 只 有 
通过 数据 类 型 ， 你 才能 准确 地 知道 每 个 变量 可 以 存储 哪些 值 、 可 以 使 用 哪些 文字 常量 ， 以 及 
可 以 执行 哪些 操作 。 例 如 ,假设 你 希望 计算 四 个 整数 如 1、2、3 和 4 的 平均 值 ， 自 然 地 ， 你 
会 想到 表达 式 〈1+2+3+4 ) /4， 但 是 由 于 类 型 转换 约定 ， 它 产生 的 是 int 值 2 而 不 是 double 
值 2.5。 问 题 源 于 操作 数 是 int 值 ， 而 结果 需要 double 数据 类 型 ， 因 此 在 某 些 时 候 需 要 从 int 
转换 为 double。 在 Java 中 有 多 种 实现 数据 类 型 转换 的 方法 。 

隐 式 类 型 转换 (implicit type conversion)。 即 使 预期 的 结果 是 double 值 ， 你 也 可 以 使 用 
int 值 ， 因 为 Java 会 适当 地 将 整数 自动 转换 为 实数 值 。 例 如 ,“11*0.25” 的 计算 结果 为 2.75， 
这 是 由 于 0.25 是 一 个 double 类 型 的 数字 ， 而 两 个 操作 数 必须 是 同一 类 型 ， 因 此 11 被 转换 为 
double 型 ， 而 两 个 double 类 型 的 操作 数 的 结果 是 double 型 。 另 一 个 例子 如 Math.sqrt(4) 结 
果 为 2.0， 因 为 Math.sqrt() 预期 接收 的 参数 是 double 类 型 ， 因 此 4 被 自动 转换 为 double 类 
型 ， 然 后 它 返 回 一 个 double 值 。 这 种 转换 称 为 自动 升级 (automatic promotion) 或 自动 转换 
( coercion)。 在 这 些 使 用 场景 中 ,编程 人 员 的 意图 很 明确 ， 而 且 类 型 转换 也 不 会 损失 信息 ， 
因此 系统 进行 自动 类 型 转换 是 非常 合理 的 。 相 反 ， 如 果 类 型 转换 可 能 会 导致 信息 丢失 ( 例 
如 ， 将 一 个 double 值 赋 给 int 变量 )， 那 么 Java 会 产生 一 个 编译 时 错误 。 

显 式 转型 (explicit cast)。 当 意识 到 可 能 会 发 生 信息 丢失 时 ， 你 可 以 使 用 Java 内 置 的 基 
本 数据 类 型 转换 方法 。 在 进行 显 式 转型 时 ， 你 必须 使 用 转型 ( cast) 操作 : 表达 式 的 前 面 使 
用 一 对 括号 ， 在 括号 内 填写 所 需 转 换 的 类 型 名 称 ， 就 可 以 将 表达 式 从 原 有 的 基本 类 型 转换 为 
目标 类 型 。 例 如 ， 表 达 式 “(inb2.71828” 能 够 实现 从 double 到 int 的 转换 ， 它 的 结果 是 一 个 
值 为 2 的 int 型 变量 。 在 类 型 转换 的 过 程 中 ，Java 定义 了 合理 的 方式 以 丢弃 信息 (详细 的 处 
理 方式 请 参阅 本 书 官网 )。 例 如 ， 将 浮 点 数 转 换 为 整数 时 会 舍弃 小 数 部 分 。RandomInt (程序 
1.2.5 ) 是 一 个 在 实际 计算 中 使 用 类 型 转换 的 例子 。 





表达 式 表达 式 类 型 表达 式 值 
《1 + 2 二-3+ 4 人 40 double 2 
Math.sqrt(4) double 2.0 
"1234" + 99 String "123499" 
11 * 0.25 double 2.75 
(dm€)! 11 + 0-25 double 2075 
11 * (int) 0.25 int 0 
(int) (11 * 0.25) int 2 
(int) 2.71828 int 2 
Math .round(2.71828) long 3 
(int) Math.round(2.71828) int 3 
Integer .parseInt("1234") int 1234 


典型 的 类 型 转换 


转型 操作 的 优先 级 高 于 算术 运算 ， 即 转型 操作 仅 应 用 于 紧 随 其 后 的 值 。 例 如 ， 对 于 代 
码 “ int value= (inb 11*0.25”， 类 型 转换 没有 什么 作用 ， 因 为 11 已 经 是 一 个 整数 ， 所 以 在 它 
前 面 的 (int) 没有 任何 效果 。 在 此 示例 中 ,编译 器 会 产生 错误 信息 ， 提 示 存 在 精度 丢失 的 风 
险 ， 因为 乘法 的 计算 结果 为 (2.75 ), 将 它 赋值 给 value 时 会 自动 转换 为 int 类 型 ， 这 个 过 程 
将 导致 精度 损失 。 对 于 程序 员 而 言 ， 此 代码 的 预期 计算 结果 可 能 是 (int) ( 11*0.25 )， 其 值 为 


2, 而 不 是 2.75。 






程序 1.2.5 ”通过 类 型 转换 得 到 一 个 随机 整数 


编程 元 黄 










public class RandomInt 


public static void main(String[] args) 
{ 








int n = Integer.parseInt(args[0]); 


System.out.printin(value); 


double r = Math.random(); “// 返回 结果 在 0.0 和 开 .0 之 间 
int_value = (Cint) Cr * n); //- 返 回 结果 在 0 和 hh 一 1 之 间 











类 型 转换 将 结果 截断 为 0 到 n-1 之 间 的 整数 值 。 


% javac RandomInt.java 
% java RandomInt 1000 
548 
% java RandomInt 1000 
141 
% java RandomInt 1000000 
135032 


显 式 类 型 转换 ( explicit type conversion)。Java 中 可 以 以 一 种 数据 类 型 为 参数 ， 结 果 形 
成 另外 一 种 数据 类 型 。 我 们 已 经 使 用 过 IntegerparseInt(0 和 Double.parseDouble() 库 方法 ， 
它们 分 别 能 够 将 Strings 值 转换 为 int 和 double 值 。 还 有 许多 其 他 方法 可 以 用 于 类 型 之 间 的 转 
换 。 例 如 ， 库 方法 Math.round() 的 参数 是 double 类 型 ， 经 过 四 舍 五 人 ， 返 回 一 个 long 类 型 
的 结果 。 因 此 ，Math.round(3.14159) 和 Math.round(2.71828) 的 结果 都 是 long 类 型 值 3。 如 


该 程序 使 用 Java 方 法 Math.random0 生 成 0.0( 含 ) 和 1.0 (不 含 ) 之 间 的 随机 
数 r， 然 后 将 / 乘 以 命令 行 参数 z 以 获得 大 于 或 等 于 0 并 小 于 /的 随机 数 ， 然 后 使 用 













果 你 要 将 Math.round() 的 结果 转换 为 一 个 int， 则 必须 使 用 显 式 转型 操作 。 


最 开始 ,程序 员 认 为 处 理 类 型 转换 令 人 烦恼 ,但 有 经 
验 的 程序 员 知道 ， 关注 数 据 类 型 是 编程 成 功 的 关键 ， 也 可 
能 是 避免 失败 的 关键 。 在 1985 年 那 次 著名 的 事件 〈 阿 丽 
亚 娜 5 号 火箭 爆炸 事故 ) 中 ， 法 国 火 箭 由 于 类 型 转换 问题 
导致 在 空中 爆炸 。 虽 然 你 的 程序 中 的 错误 可 能 不 会 引起 爆 
炸 , 但 是 请 你 花 点 时 间 了 解 所 有 类 型 的 转换 。 在 编写 了 几 
个 程序 之 后 ， 你 将 看 到 对 数据 类 型 的 理解 不 仅 可 以 帮助 你 
编写 紧凑 的 代码 ， 还 能 使 你 的 意图 更 明确 ， 从 而 避免 程序 


图 片 提 供 : ESA 
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中 的 细微 错误 。 

总 结 ”数据 类 型 是 一 组 值 和 基于 这 些 值 的 操作 。Java 中 有 八 种 基本 数据 类 型 : boolean、 
char、byte、short、int、long、float 和 double。 在 Java 代码 中 ， 我们 使 用 运算 符 和 表达 式 
来 调用 与 每 个 类 型 相关 联 的 操作 ， 这 些 操作 的 使 用 规则 与 我 们 所 熟悉 的 数学 运算 规则 相同 。 
boolean 类 型 的 数值 只 有 逻辑 值 true 和 false， 对 应 的 操作 是 逻辑 运算 ; char 类 型 用 于 表示 我 
们 键入 的 字符 的 集合 ; 而 其 他 六 种 数值 类 型 用 于 进行 数值 计算 。 在 本 书 中 ， 我 们 会 经 常 使 用 
boolean 、int 和 double 类 型 ;几乎 不 使 用 short 或 float 类 型 。 我 们 也 经 常 使 用 另 一 种 数据 类 
型 一 一 String 类 型 ， 它 虽然 不 是 基本 数据 类 型 ， 但 Java 为 之 提供 了 与 基本 类 型 类 似 的 一 些 工 
具 方 法 。 

当 使 用 Java 编程 时 ， 我 们 必须 意识 到 ， 每 个 操作 仅 在 其 相应 的 数据 类 型 的 上 下 文中 有 
意义 ， 因 此 我 们 可 能 需要 进行 类 型 转换 。 所 有 类 型 都 只 能 有 有 限 数量 的 值 ， 因 此 我 们 获得 的 
结果 可 能 不 精确 。 

布尔 类 型 及 其 操作 &&、|| 和 ! 是 Java 程序 中 逻辑 决策 的 基础 ， 它 们 经 常 与 比较 运算 符 
(==、! =、<、>、<= 和 >=) 联合 使 用 。 具 体 来 说 ,我 们 使 用 布尔 表达 式 来 控制 Java 的 条 件 (if) 
和 循环 (for 和 while) 结构 ， 相 关内 容 我 们 将 在 下 一 节 中 详细 介绍 。 

数值 类 型 和 Java 库 使 我 们 能 够 将 Java 用 作 一 个 功能 强大 的 数学 计算 器 。 我 们 可 以 使 用 
内 置 的 运算 符 +、-、*、/ 和 %， 并 配合 Math 库 中 的 Java 方法 ， 来 编写 复杂 的 算术 表达 式 。 

虽然 以 后 续 内 容 的 标准 来 看 本 节 中 的 程序 是 非常 简单 的 ， 但 本 节 中 的 这 类 程序 非常 有 
用 。 你 将 在 Java 编程 中 广泛 使 用 基本 类 型 和 基本 数学 函数 ， 因 此 你 现在 花 时 间 理 解 它们 一 
定 是 值得 的 。 
问答 环节 

1. 字符 串 

问 : Java 如 何在 内 部 存储 字符 串 ? 

答 : Unicode 是 用 于 编码 文本 的 现代 标准 ， 字 符 串 是 使 用 Unicode 编码 的 字符 序列 。 
Unicode 支持 超过 100 000 个 不 同 的 字符 ， 包 括 超 过 100 种 不 同 的 语言 ， 以 及 数学 和 音乐 符号 。 

问 : 可 以 使 用 “<” 和 “>” 来 比较 String 值 吗 ? 

答 : 不 可 以 。 这 些 运 算 符 仅 用 于 基本 类 型 值 。 

问 :“ 王 ”和 “!=” 呢 ? 

答 : 可 以 ， 但 结果 可 能 与 你 预期 的 不 一 样 。 以 上 运算 符 对 于 非 基本 数据 类 型 的 含义 不 
同 。String 类 型 的 变量 和 变量 的 值 之 间 是 有 区 别 的 。 假 设 x 是 值 为 "c" 的 字符 串 时 ， 表 达 式 
"abc"=="ab"+x 的 结果 为 false， 因 为 两 个 操作 数 存 储 在 内 存 中 的 不 同位 置 (即使 它们 具有 相 
同 的 值 )。 这 个 区 别 是 至 关 重要 的 ， 所 以 我 们 将 会 在 3.1 节 中 更 详细 地 讨论 这 个 区 别 ， 到 那 
时 你 将 会 明白 为 什么 会 这 样 。 

问 : 如 何 比 较 两 个 字符 串 ， 如 查找 书 中 的 索引 或 从 字典 中 查找 单词 ? 

答 : 我 们 将 在 3.1 节 介 绍 面向 对 象 编 程 时 讨论 String 数据 类 型 和 相关 方法 。 在 此 之 前 ， 
String 连接 操作 就 足够 用 了 。 

问 : 如 果 需 要 输入 的 字符 串 文字 常量 太 长 ， 一 行 显示 不 完整 该 怎么 办 ? 

答 : 不 可 以 一 次 输入 过 长 的 字符 串 常 量 。 如 果 需 要 ， 应 将 字符 串 文字 常量 划分 为 独立 的 
字符 串 文字 并 将 它们 连接 在 一 起 ， 如 以 下 示例 所 示 : 


String dna = "ATGCGCCCACAGCTGCGTCTAAACCGGACTCTG” + 
"AAGTCCGGAAATTACACCTGTTAG™; 

2. 整数 

问 : Java 如 何在 内 部 存储 整数 ? 

答 : 在 Java 中 ， 较 小 的 正 整 数 的 表示 方法 最 为 简单 ， 它 使 用 的 是 二 进 制 数字 系统 
(binary number system)， 每 个 整数 无 论 大 小 都 使 用 固定 容量 的 计算 机 存储 器 单元 来 表示 。 

问 : 什么 是 二 进 制 数字 系统 ? 

答 : 在 二 进 制 数字 系统 中 ， 我 们 将 整数 表示 为 一 个 比特 序列 。 一 个 比特 (位 ) 就 是 一 个 
三 进 制 信息 ， 它 的 值 是 0 或 1; 三 进 制 是 表示 计算 机 信息 的 基础 。 三 进 制 数字 系统 是 基数 为 
2 的 数字 系统 ， 即 对 于 每 一 个 比特 ， 比 特 所 在 的 位 数 是 2 的 指数 ， 而 这 些 比特 的 值 就 是 对 应 
项 的 系数 。 具 体 地 ， 比 特 序列 b,b,-1…b2bibo 的 值 换算 成 整数 是 : 

ba2"+bn12" '+***+b222+bi2!+bo02° 
例如 ，1100011 的 整数 值 是 : 
99=1 * 64+1 + 32+0 * 16+0 “8+0* 4+1 * 2+1 * 1 

二 进 制 数 字 系 统 与 我 们 所 熟悉 的 十 进 制 数 字 系 统 ( decimal number system) 使 用 的 是 相 
同 的 机 理 ， 只 是 十 进 制 中 的 数字 分 布 在 0 和 9 之 间 ， 基 数 是 10。 我 们 将 在 下 一 节 中 涉及 如 
何 将 数字 转换 为 二 进 制 。Java 使 用 32 位 来 表示 一 个 int 值 。 例 如 ,十进制 整数 99 可 以 用 32 
位 的 00000000000000000000000001100011 表示 。 

问 : 负数 是 如 何 表示 的 ? 

答 : 负数 需要 按照 二 进 制 补 码 (two’s complement) 的 规则 来 处 理 ， 我 们 不 做 详细 介绍 。 
需要 注意 的 是 ，Java 中 的 int 值 范围 是 -2147483648 ( -2 ) 到 2147483647 (23-1)， 并 不 
是 完全 对 称 的 。 当 int 值 变 大 并 溢出 时 ，int 值 可 能 变 为 负数 (超过 2147483647 )。 如 果 你 没 
有 遇 到 这 种 现象 ， 请 参阅 练习 1.2.10。 为 了 避免 溢出 现象 ,一 个 安全 的 做 法 是 ， 当 你 知道 要 
存储 的 整数 值 少 于 10 位 数 时 ， 可 以 使 用 int 类 型 ， 当 你 认为 整数 值 可 能 达到 10 位 以 上 时 ， 
则 使 用 long 类 型 。 

问 : Java 允许 int 溢 出 并 给 出 一 个 “错误 值 ” 似 乎 是 不 合理 的 。Java 能 不 能 自动 检查 
溢出 ? 

答 : 在 这 个 问题 上 ， 程 序 员 中 一 直 存 有 争议 。 一 个 简短 的 解释 是 ，Java 不 检测 溢出 是 因 
为 int 类 型 目前 并 没有 很 好 的 检测 溢出 的 机 制 ， 这 也 是 这 些 类 型 被 称 为 “基本 数据 类 型 ”的 
原因 之 一 。 只 要 程序 员 具 备 了 一 些 基 础 知识 就 可 以 有 效 避 免 溢 出 的 问题 。 记 住 ， 对 于 小 数 
字 , 使 用 int 类 型 是 没有 问题 的 ， 但 是 当 值 达到 数 十 亿 的 时 候 ， 就 不 能 再 使 用 了 。 

问 : Math.abs (-2147483648 ) 的 值 是 多 少 ? 

答 : -2147483648。 这 个 结果 很 奇怪 ; 但 确实 如 此 。 这 是 由 整数 溢出 和 二 进 制 补 码 表示 
方式 造成 的 ， 这 是 一 个 很 典型 的 例子 。 

问 : 在 Java 中 ， 表 达 式 1/0 和 1%0 的 计算 结果 是 什么 ? 

答 : 当 表 达 式 中 除数 为 零 时 会 生成 运行 时 异常 (exception)。 

问 : 负 整 数 的 除法 和 余数 是 什么 ? 

答 : 除法 运算 a/b 会 向 0 取 整 ， 而 取 模 操作 a%b 的 定义 是 ， 使 得 (a/b) *b+a%b 总 是 等 
于 a。 例 如 ，-14/3 和 14/-3 都 是 -4; 而 -14%3 是 -2，14%-3 是 2。 关于 负 整 数 的 除法 和 
取 模 操作 ， 其 他 一 些 语言 (例如 Python) 可 能 有 不 同 的 运算 方法 。 
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问 : 为 什么 105 的 值 不 是 1000000， 而 是 12 ? 

答 : ^ 运 算 符 不 是 指数 运算 符 ， 它 是 和 逐 位 异 或 运算 符 。 如 果 你 想 计 算 1000000， 你 可 以 
输入 le6， 也 可 以 使 用 Math.pow ( 10，6 )。 需 要 说 明 的 是 ， 使 用 pow 方法 输入 一 个 10 的 已 
知 寡 次 会 浪费 计算 资源 。( 因 为 对 于 已 知 的 寡 次 可 以 输入 为 文字 常量 ， 而 pow 方法 会 转换 为 
方法 调用 ， 需 要 运算 才能 得 到 。 一 一 译 者 注 ) 

3. 浮 点 数 

问 : 为 什么 实数 的 类 型 被 命名 为 double ? 

答 : 在 表示 实数 时 ， 小 数 点 可 以 在 构成 实数 的 数字 之 间 “ 浮 动 ” 。 相 反 ， 在 表示 整数 时 ， 
小 数 点 被 固定 在 最 后 一 位 有 效 数 字 的 后 面 ， 而 且 我 们 并 不 刻意 把 它 显 示 出 来 。( 因 此 ， 实 数 
又 被 称 为 浮 点 数 float， 而 double 是 双重 精度 的 float。 一 一 译 者 注 ) 

问 : Java 如 何在 内 部 存储 浮 点 数 ? 

答 : Java 的 浮 点 数 存储 遵循 IEEE 754 标准 ， 这 也 是 大 多 数 现代 计算 机 系统 硬件 支持 的 
标准 。 该 标准 规定 一 个 浮 点 数 需 使 用 符号 位 、 尾 数 和 指数 共同 来 定义 。 如 果 你 有 兴趣 ， 请 参 
阅 本 书 官网 了 解 更 多 详情 。IEEE 754 标准 还 规定 了 特殊 的 float 值 零 、 负 零 、 正 无 穷 
大 ， 负 无 穷 大 ,以 及 NaN (不 是 数字 )。 特 别 需 要 说 明 的 是 ， 浮 点 运算 不 会 导致 运行 时 异常 。 
例如 ， 表 达 式 -0.0/3.0 计算 为 -0.0， 表 达 式 1.0/0.0 计算 为 正 无 穷 大 ，Math.sqrt ( -2.0 ) 计算 
为 NaN。 

问 : 浮 点 数 有 15 位 有 效 数 字 ， 这 对 我 来 说 似乎 足够 了 。 我 真 的 需要 关心 精度 吗 ? 

答 : 是 的 ， 因 为 你 所 习惯 的 实数 和 数学 是 基于 无 限 精 度 的， 而 计算 机 内 能 处 理 有 限 的 近 
似 。 例 如 ,表达 式 ( 0.1+0.1==0.2 ) 计算 为 真 ， 但 表达 式 (0:1+0.1+0.1==0.3 ) 计算 结果 为 假 ! 
像 这 样 的 陷阱 在 科学 计算 程序 中 并 不 少见 ， 因 此 新 手 程序 员 应 避免 将 两 个 浮 点 数 进行 比较 。 

问 : 如 何 初始 化 double 变量 为 NaN 或 无 穷 大 ? 

答 : Java 具有 可 用 于 此 目的 的 内 置 常量 : Double.NaN、Double.POSITIVE JINEFINITY 
和 了 DoubleNEGATIVE INFINITY。 

问 : Java 的 Math 函数 库 中 是 否 有 其 他 三 角 函 数 的 功能 ， 如 余 割 、 正 割 和 余 切 ? 

答 : 没有 。 但 你 可 以 使 用 Math.sin()、Math.cos() 和 Math.tan() 来 计算 它们 。Java 面向 
众多 用 户 , 但 每 个 用 户 所 需要 的 方法 不 同 ， 因 此 ， 如 何 选择 API 集合 就 需要 找到 一 个 合理 
的 折 中 。 如 果 要 求 API 集 合 中 包含 每 一 个 可 能 使 用 到 的 方法 ， 那 么 这 个 集合 就 会 很 大 ， 查 
找 所 需要 的 函数 的 过 程 就 会 很 痛苦 。 例 如 ， 你 可 以 使 用 Math.sin (x) /Math.cos (x) 计算 正 
切 值 ， 而 API 中 同时 还 提供 了 Math.tan (x)。 

问 : 打印 double 类 型 数字 时 显示 出 全 部 小 数 是 烦人 的 ， 是 否 可 以 使 用 System.out.println() 
函数 只 打印 小 数 点 后 两 位 或 者 后 三 位 ? 

答 : 要 实现 这 个 功能 ， 需 要 深入 研究 将 double 转换 为 String 的 方法 。Java 库 函数 
System.out.printf() 提供 了 一 个 基础 打印 功能 ，C 语言 和 许多 现代 语言 中 也 使 用 这 一 方法 ,我 
们 会 在 1.5 节 详 细 讲 解 。 在 此 之 前 ,我 们 只 能 把 所 有 数字 都 打印 出 来 (这 也 并 非 全 是 坏事 ， 
因为 这 样 有 助 于 我 们 记 住 这 些 基本 类 型 的 差异 )。 

4. 变量 和 表达 式 

问 : 如 果 忘 记 声 明 一 个 变量 会 怎么 样 ? 

答 : 在 表达 式 中 引用 该 变量 时 ， 编 译 器 会 报错 。 例 如 ， 假 设 IntOpsBad 是 与 程序 1.2.2 
完全 相同 的 一 段 代码 ， 只 是 去 掉 了 变量 p 的 声明 (原来 被 声明 为 int 类 型 ) 。 





编程 雹 法 呈 


% javac IntOpsBad.java 
IntOpsBad.java:7: error: cannot find symbol 
p=a*b; 
入 
Symbol : variable p 
location: class IntOpsBad 
IntOpsBad.java:10: error: cannot find symbol 
System.out.println(a + "* "+b+"=" +Pp); 
入 
Symbol : variable p 
location: class IntOpsBad 
2 errors 


编译 器 会 报告 两 个 错误 ,但 实际 上 只 有 一 个 : p 的 声明 被 漏 掉 了 。 如 果 忘 记 声 明 经 常 使 
用 的 变量 ， 则 会 收 到 一 系列 错误 消息 。 最 好 的 解决 办 法 是 修改 第 一 个 错误 ， 有 时 后 面 的 错误 
会 因为 第 一 个 错误 被 修改 而 被 同时 修改 。 

问 : 如 果 忘 记 初 始 化 一 个 变量 会 怎么 样 ? 

答 : 编译 器 会 检查 这 种 错误 ， 如 果 你 在 初始 化 之 前 尝试 使 用 表达 式 中 的 变量 ， 则 会 给 你 
一 个 变量 未 被 初始 化 的 错误 消息 。 

问 : = 和 == 运算 符 之 间 有 区 别 吗 ? 

答 : 有 ， 它 们 有 很 大 的 不 同 ! 第 一 个 是 改变 变量 值 的 赋值 运算 符 ， 第 二 个 是 生成 布尔 结 
果 的 比较 运算 符 。 你 能 否 正确 地 回答 这 个 问题 ， 取 决 于 你 是 否 真正 理解 了 本 节 中 关于 这 部 分 
的 内 容 。 

问 : double 型 变量 可 以 与 int 型 变量 进行 比较 吗 ? 

答 : 不 进行 类 型 转换 则 无 法 比较 ， 但 要 说 明 的 是 , Java 通常 会 自动 进行 必要 的 类 型 转换 。 
例如 ， 如 果 x 是 int 型 变量 且 值 为 3， 则 表达 式 (x<3.1 ) 为 真 ， 因 为 在 执行 比较 之 前 ，Java 
会 将 x 转换 为 double 型 (因为 3.1 是 double 型 常量 )。 

问 : 语句 “a=b=c=17;” 是 否 将 17 赋值 给 三 个 整数 变量 a、b 和 和 <? 

答 : 是 的 。 Java 中 的 赋值 语句 是 一 个 表达 式 ( 这 个 表达 式 的 计算 结果 是 赋值 符 右边 的 值 )， 
赋值 操作 符 是 右 结合 的 (因此 ， 这 个 表达 式 可 以 结合 为 a=(b=(c=17))， 其 中 c=17 的 运算 结 
果 就 是 17， 以 此 类 推 , 三 个 变量 都 被 赋值 为 17。 一 一 译 者 注 )。 但 是 ， 这 并 不 是 一 种 很 好 的 
编程 风格 ,我 们 在 本 书 中 不 使 用 这 样 的 连续 赋值 (chained assignment)。 

问 : 表达 式 (a<b<c) 可 以 测试 三 个 整数 变量 a、b 和 < 的 值 是 否 严格 按照 升序 排列 吗 ? 

答 : 不 可 以 。 这 个 表达 式 无 法 通过 编译 ， 因 为 表达 式 a<b 会 产生 一 个 布尔 值 ， 然 后 将 它 
与 一 个 int 值 进行 比较 。Java 不 支持 连续 比较 ( chained comparison)。 如 果 想 实现 连续 比较 
的 功能 ， 你 需要 写成 (a<b && b<c)。 

问 : 为 什么 我 们 用 (a &K&b) 而 不 是 (a & b) ? 

答 : Java 也 有 一 个 有 运算 符 ， 在 更 复杂 的 高 级 编程 课程 中 你 可 能 会 遇 到 。 

问 : Math.round (6.022e23 ) 的 值 是 多 少 ? 

答 : 你 应 该 习惯 于 编写 一 个 Java 小 程序 来 自己 寻找 这 些 问题 的 答案 (并 思考 程序 产生 
这 个 结果 的 原因 )。 

问 : 我 听 说 Java 被 称 为 静态 类 型 语言 (statically typed language)。 这 是 什么 意思 ? 

答 : 静态 类 型 意味 着 每 个 变量 和 表达 式 的 类 型 在 编译 时 是 已 知 的 。Java 也 在 编译 时 验 
证 和 保障 类 型 约束 。 例 如 ， 如 果 你 试图 用 int 类 型 的 变量 存储 double 类 型 的 值 ， 或 者 使 用 
String 类 型 的 变量 作为 参数 调用 Math.sqrt()， 程 序 都 会 在 编译 时 遇 到 错误 。 
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假设 a 和 b 是 整 型 变量 。 下 面 语句 的 运行 结果 是 ? 
int t=a;b=t;a=b; 


编写 一 个 程序 ， 使 用 库 函 数 Math.sin() 和 Math.cos() 来 检查 cos*9+sin”6 的 值 是 否 约 等 于 1， 其 
中 9 是 由 命令 行 参数 输入 的 任意 值 。 把 计算 的 数值 打印 出 来 。 为 什么 这 些 值 不 总 是 等 于 1? 
假设 a 和 b 是 布尔 变量 。 证 明 表达 式 (1! (a&&b) && (allb))|((a&&b)1l!(allb)) 的 计 
算 结果 为 true。 
假设 a 和 b 是 整 型 变量 。 简 化 以 下 表达 式 : (! (a<b) && ! (a>b))。 
布尔 运算 的 异 或 运算 符 人 的 定义 是 : 如 果 两 个 操作 数 不 同 则 结果 为 真 ; 如 果 相 同 则 结果 为 假 。 
写 出 这 个 函数 的 真 值 表 。 
为 什么 10/3 的 值 为 3， 而 不 是 3.333333333 ? 

答案 : 由 于 10 和 3 都 是 整数 ， 所 以 Java 认为 不 需要 进行 类 型 转换 ， 可 以 直接 使 用 整数 
除法 。 如 果 你 想 让 数字 按照 double 类 型 处 理 ， 你 应 该 写成 10.0/3:0。 同 样 的 道理 ，10/3.0 或 
10.0/3 也 会 得 到 相同 的 结果 ， 因 为 Java 会 进行 隐 式 转换 。 
以 下 各 项 会 打印 出 什么 结果 ? 
a. System.out.println(2+"bce"); b. System.out.println(2+3+"bc"); 
c. System.out.println((2+3)+"bc"); d. System.out.println("bc"+(2+3)); 
e. System.out.println("bc"+2+3); 
并 解释 其 原因 。 
如 何 利用 程序 1.2.3 求 一 个 数 的 平方 根 。 
以 下 每 项 打印 结果 是 什么 ? 
a. System.out.println('b'); b. System.out.println('b'+'c); 
c. System.out.println((char) ('a'+4)); 


并 解释 其 原因 。 


假设 变量 a 的 声明 如 下 : int a =2147483647 (这 个 值 就 是 Integer.MAX_VALUE)。 以 下 各 项 打 
印 结 果 是 什么 ? 

a. System;out.println(a); b. System.out.printin(at+1); 

c. System.out.println(2—a); d. System.out.println(-2-a); 

e. System.out.println(2*a); f. System.out.println(4*a); 

并 解释 其 原因 。 

假设 变量 a 的 声明 如 下 : double a = 3.14159。 以 下 各 项 打印 结果 是 什么 ? 

a. System.out.println(a); b. System.out.println(a+1); 

c. System.out.println(8/(int) a); d. System.out.println(8/a); 


e. System.out.println((int) (8/a)); 

并 解释 其 原因 。 

描述 在 程序 1.2.3 中 使 用 sqrt 而 不 是 Math.sqrt 会 发 生 什么 情况 。 

求 表达 式 (Math.sqrt(2)* Math.sqrt(2)== 2) 的 值 。 

编写 一 个 程序 ， 该 程序 将 两 个 正 整数 作为 命令 行 参 数 ， 如 果 其 中 一 个 能 将 另 一 个 整除 ， 则 打 
印 结果 true。 
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编写 一 个 程序 ， 它 将 三 个 正 整 数 作为 命令 行 参数 ， 如 果 其 中 任何 一 个 大 于 或 等 于 另外 两 个 的 和 ， 
则 输出 色 lse， 否 则 输出 true。( 注 意 : 这 个 计算 用 于 测试 三 个 数字 是 否 可 以 是 某 个 三 角形 的 边 长 。) 
假设 物理 系 学 生 想 在 程序 中 计算 公式 F=Gmim2/r*， 他 写 出 如 下 代码 : 


double force = G * massl * mass2 /r*r; 


这 个 表达 式 会 产生 意 想不到 的 结果 。 解 释 出 现 的 问题 并 更 正 代 码 。 
在 执行 以 下 每 个 语句 之 后 ， 给 出 变量 a 的 值 : 

inta= 1; boolean a = true; int a=2; 

a=a+a; a= la; a=Aa* ad; 


a=a+a; aa Ila; a=aw* a 
a= 有 +ai a =, Ila; 入 二 六, 二 二 


编写 一 个 程序 ， 该 程序 需要 两 个 浮 点 命令 行 参数 x 和 y， 并 打印 从 点 (x，y) 到 原点 (0，0 ) 
的 欧 几 里 得 距离 。 

编写 一 个 程序 ， 该 程序 需要 两 个 整数 型 命令 行 参数 a 和 b， 打 印 一 个 a 和 b 之 间 ( 含 a 和 b) 的 
随机 整数 。 

编写 一 个 程序 ， 打 印 1 和 6 之 间 的 两 个 随机 整数 的 和 (计算 结果 就 是 掷 货 子 时 可 能 得 到 的 值 )。 
编写 一 个 程序 ， 命 令 行 参 数 为 double 型 变量 :， 输 出 sin (21) +sin (37) 的 值 。 

编写 一 个 程序 ， 该 程序 需要 三 个 double 型 命令 行 参数 m、w 和 t+， 并 输出 xotvot-g2/2 的 值 ， 
其 中 g 是 常数 9.80665。 (注意 : 这 个 值 表 示 的 是 一 个 物体 在 xzo 位 置 按照 w 的 初始 速度 竖 直 向 
上 抛 出 经 过 1 秒 之 后 的 位 移 ， 单 位 是 米 。) 

编写 一 个 程序 ， 该 程序 需要 两 个 整 型 命令 行 参数 m 和 d， 如 果 以 这 两 个 值 作为 日 期 即 m 月 
d 日 在 3 月 20 日 和 6 月 20 日 之 间 ， 则 输出 true， 否则 返回 false。 
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连续 复 利 。 假 设 投 资 P 美 元 ,年 利率 为 rx (计算 复 利 ) (计算 复 利 是 指 利息 部 分 仍 参与 计 
息 。 一 一 译 者 注 )。 计 算 年 后 的 资产 金额 。 结 果 可 以 由 公式 Pe” 算出 。 
风寒 指数 。 国 家 气象 部 门 对 风 塞 指数 的 定义 如 下 式 ， 其 中 7 为 温度 (华氏 度 ), v 为 风速 (英里 9 
每 小 时 )。 
w=35.74+0.6215 T+(0.4275 7T-35.75)v"! 

写 一 个 程序 ， 输 入 两 个 double 型 命令 行 参数 ， 分 别 表示 温度 和 速度 ， 计 算 风 寒 指 数 。 使 
用 Math.pow(a，b) 来 计算 a。 注意 : 如 果 了 的 绝对 值 大 于 50, 或 者 v 大 于 120 或 者 小 于 3 公式 
是 无 效 的 ， 为 了 简单 起 见 ， 可 以 假设 你 得 到 的 输入 值 一 定 是 在 这 个 范围 内 的 。 
极 坐 标 。 编 写 程序 将 笛 卡 儿 坐 标 转换 为 极 坐标 。 你 的 程序 应 该 假设 两 个 
double 型 命令 行 参数 x 和 y， 并 输出 极 坐 标 r 和 6 。 使 用 Math.atan2 (y，x) 
方法 计算 y/x 的 反正 切 值 ， 其 值 在 -~m 到 ~ 的 范围 内 。 | 
高 斯 随机 数 。 编 写 一 个 程序 RandomGaussian， 用 于 显示 一 个 服从 高 斯 分 布 的 极 坐标 
随机 数 >。 实 现 这 一 功能 的 一 种 有 效 方法 是 使 用 Box-Muller 公式 : 

r=sin(27v) (-2 jn 2 

其 中 wu 和 v 是 由 Math.random() 方 法 随机 生成 的 0 到 1 之 间 的 实数 。 
顺序 检测 。 编 写 一 个 程序 ， 该 程序 需要 输入 三 个 double 型 的 命令 行 参数 x、y 和 z， 如 果 值 严 
格 上 升 或 下 降 (x<y<z 或 x>y>z)， 则 输出 true， 否 则 输出 false。 


昌 1 英里 二 1609.344 米 。 一 一 编辑 注 
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第 1 茧 


星期 几 。 编 写 程序 ， 将 日 期 作为 输入 ， 并 输出 当天 是 星期 几 。 你 的 程序 应 该 假设 三 个 int 命令 
行 参数 : m (月 )、d (日 ) 和 y (年 )。 对 于 m, 1 代表 一 月 ，2 代 表 三 月 ， 以 此 类 推 。 对 于 输出 ， 
0 为 星期 天 ，1 为 星期 一 ，2 为 星期 二 ， 以 此 类 推 。 你 可 以 使 用 以 下 公式 : 

yo=y—(14-m)/12 

X=yotyo/4—yo/100+yo/400 

mo=m+12 X ((14-m)/12)-2 

do=(d+x+(31 X mo)/12)%7 

例 : 2000 年 2 月 14 日 是 星期 几 ? 

yo=2000-1=1999 

X=1999+1999/4-1999/100+1999/400=2483 

mo=2+12 X 1=2=12 

do=(14+2483+(31X 12)/12) % 7=2500 % 7=1 

答 : 星期 一 。 

均匀 分 布 随机 数 。 写 一 个 程序 ， 打 印 0 和 1 之 间 的 5 个 均匀 分 布 随 机 数 ， 并 计算 它们 的 平均 
值 、 最 小 值 和 最 大 值 。 你 可 以 使 用 Math.random()、Math.min() 和 Math.max() 等 库 函 数 。 
墨 卡 托 投影 。 墨 卡 托 投影 是 一 个 保 形 (能够 保留 角度 ) 投影 法 ,经 常用 于 将 球 坐标 (纬度 $ 和 


经 度 4) 映射 到 直角 坐标 (x，y)。 该 方法 常用 于 处 理 海 图 和 地 图 。 投 影 由 方程 x=4-ho， y=3In 


((1l+tsing ) / (1-sing )) 定义 ， 其 中 加 是 地 图 中 心 点 的 经 度 。 编 写 一 个 程序 ， 从 命令 行 获取 
加 和 点 的 经 纬度 并 打印 其 投影 。 
颜色 转换 。 表 示 颜 色 的 数据 格式 有 多 种 。 例 如 ， 在 RGB 格式 中 ,使 用 三 个 整数 分 别 表示 红 
(R)、 绿 (G) 和 蓝 (B) 的 级 别 ， 整 数 的 取 值 范围 是 从 0 到 255。 这 种 格式 主要 用 于 LED 显示 
器 、 数 码 相机 和 网 页 配色 。 出 版 书籍 和 杂志 主要 使 用 的 格式 是 CMYK 格式 ， 使 用 4 个 实数 分 
别 表示 青色 (C)、 品 红色 (M)、 黄 色 (Y) 和 黑色 (KK) 的 等 级 ， 实 数 的 取 值 范围 是 从 0.0 到 
1.0。 编 写 一 个 程序 RGBtoCMYK， 将 RGB 转换 为 CMYK。 从 命令 行 取 三 个 整数 r、g 和 4b 并 
打印 出 等 价 的 CMYK 值 。 如 果 RGB 值 全 部 为 0， 则 CMY 值 全 部 为 0, K 值 为 1; 否则 ,使 
用 下 面 这 些 公式 : 
w=max(r/255, g/255, b/255) 
c=(w-(r/255))/w 
m=(w-(g/255))/w 
=(w-( b/255))/w 
k=1-w 
大 圆 (大 圆 是 指 过 球 心 的 平面 和 球面 的 交 线 ,球面 十 两 点 的 最 小 距离 为 经 过 两 点 的 大 圆 的 劣 
弧 。 航 海 与 航空 中 利用 这 一 原理 而 设置 了 大 圆 航 线 。 一 一 译 者 注 )。 编 写 GreatCircle 程序 ， 它 
需要 四 个 double 型 命令 行 参数 ， 分 别 是 x1 yl、x2 和 y2， 用 于 表示 地 球 上 两 点 的 纬度 和 经 度 ， 
以 度 为 单位 ， 计 算 它们 之 间 的 大 圆 距离 。 大 圆 距离 (海里 ) 由 下 式 给 出 : 
d=60 arccos(sin(x1) sin(x2)+cos(x1) cos(x2) cos(y1—y;)) 

请 注意 ， 此 公式 使 用 度数 ， 而 Java 的 三 角 函 数 使 用 弧度 。 你 可 以 使 用 Math.toRadians() 
和 Math.toDegrees() 在 两 者 之 间 进行 转换 。 使 用 你 的 程序 计算 巴黎 ( 48.87% N，-2.33*W) 和 
旧金山 (37.8。 N，122.4。 W) 之 间 的 大 圆 距离 。 


1.2.34 三 数字 排序 。 编 写 一 个 程序 ， 该 程序 需要 输入 三 个 整数 型 命令 行 参数 ， 按 照 升 序 排 列 这 三 个 
数字 并 打印 。 你 可 以 使 用 Math.min() 和 Math.max() 库 函 数 。 


1.2.35 龙 形 曲 线 。 编 写 一 个 程序 ， 用 于 输出 绘制 龙 形 曲线 的 指令 。 各 让 3 
绘制 指令 是 Fs 工 和 RR 构成 的 字符 串 ， 其 中 下 表示 “向 前 画 | rr 
出 1 个 单位 的 直线 ", 工 表示 “向 左 转 "，R 表示 “向 右 转 ”。 
要 得 到 一 个 n 阶 的 龙 形 曲线 ， 你 可 以 将 纸 条 对 折 n/2 次 后 ， 上 人 


再 将 它 展 开 并 把 每 一 个 折 痕 展开 为 直角 。 解 决 这 个 问题 的 关 
键 是 要 注意 ， 阶 数 款 的 龙 形 曲线 是 一 个 阶 数 为 n=-1 的 龙 形 曲 UD FLFLFRFLFLFRFRF 
线 ， 后 面 跟着 一 个 L， 后 面 跟着 一 个 反 序 的 阶 数 n-1 的 龙 形 
曲线 ， 反 序 的 龙 形 曲线 的 绘制 方法 与 此 类 似 。 


1.3 条 件 语 句 与 循环 语 名 


在 我 们 之 前 已 经 研究 过 的 程序 中 ， 每 个 语句 都 按照 给 定 的 顺序 执行 一 次 。 事 实时 ， 大 多 
数 程序 部 比 那 些 程序 复杂 得 多 ， 在 语句 的 顺序 和 执行 的 次 数 上 都 会 有 变化 。 我 们 使 用 术语 控 
制 流 来 表示 程序 中 语句 的 执行 顺序 。 在 本 节 中 ， 我 们 将 介绍 一 些 语句 ， 这 些 语句 能 够 根据 程 
序 中 某 些 变量 值 的 逻辑 来 改变 控制 流 ， 是 编程 的 重要 组 成 部 分 。 

具体 而 言 ， 我 们 将 学 习 Java 中 的 条 件 语 句 ， 即 控制 其 他 某 些 语句 可 能 会 或 者 不 会 被 执 
行 的 语句 ， 具体 的 控制 标准 取决 于 某 些 特定 的 条 件 。 我 们 还 会 学 习 循 环 语句 ， 在 循环 语句 
中 ， 一 些 语句 可 能 会 执行 多 次 * 执行 的 次 数 也 取决 于 特定 的 条 件 。 正 如 你 将 在 本 节 看 到 的 那 
样 ， 条 件 和 循环 语句 真正 利用 了 计算 机 的 能 力 ， 并 且 使 你 通过 编写 程序 来 完成 各 种 各 样 的 任 
务 ， 而 这 些 任 务 在 没有 计算 机 的 情况 下 是 无 法 想象 的 。 

if 语句” 大 多 数 的 计算 需要 根据 不 同 的 输入 采用 不 同 的 方式 去 进行 。Java 中 表达 这 些 变 
化 的 一 种 方法 是 让 语句 ， 其 格式 为 : 

if (< 布尔 表达 式 >){< 语句 >} 


在 这 里 ,我 们 使 用 了 一 个 被 称 为 模板 ( template) 的 形式 符号 来 描述 Java 语句 的 结构 和 
格式 。 在 模板 中 ， 我 们 在 尖 括 号 (< >) 中 填 人 一 个 已 经 定义 好 的 结构 ， 用 于 表示 我 们 可 以 
在 这 个 位 置 填 人 该 类 型 的 语句 。 在 这 个 例子 中 ，< 布尔 表达 式 > 表示 这 个 位 置 可 以 填 人 任何 
一 个 运算 结果 为 布尔 值 的 表达 式 ， 比 如 一 个 调用 比较 操作 的 表达 式 ，< 语句 > 表示 一 个 语句 
块 (一 系列 Java 语 名)。 你 已 经 见 到 过 < 语句 > 这 样 的 结构 : main() 的 主体 就 是 这 样 一 个 语 
句 块 。 如 果 语 句 块 中 只 有 单个 语句 ， 则 花 括 号 是 可 以 省 略 的 。 我 们 可 以 对 < 布尔 表达 式 > 和 
< 语句 > 进行 更 加 严格 的 形式 化 定义 ， 但 是 我 们 不 需要 深入 探究 这 个 细节 层次 。 让 语句 的 含 [50] 
义 非常 明显 : 当 且 仅 当 表达 式 为 真 时 才 会 执行 语句 块 中 的 语句 。 
举 一 个 简单 的 例子 ,假设 你 想 计 算出 一 个 int 值 x 的 绝对 值 ， 具 体 的 做 法 是 这 样 的 : 


if (xX < 0) x = -x 


阶 数 为 0、1、2 和 3 的 龙 形 曲 线 





布尔 表达 式 
(更 确切 地 说 ， 这 段 程序 的 功能 是 用 x 的 绝对 值 来 替换 x 的 值 。) 册 
作为 第 二 个 简单 的 例子 ， 考 虑 下面 的 语句 : if (Lx > y]) 
a { 
{ 语句 序列 一 > 
int t = x; 
x=y; } 


yt 


一 个 if 语句 的 解析 


的 齐 
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此 段 代 码 的 功能 是 : 如 果 需 要 的 话 ， 交 换 两 个 变量 中 的 值 ， 将 两 个 int 值 中 较 小 的 一 个 
放 在 x 中 ， 两 个 值 中 较 大 的 一 个 放 在 y 中 。 

你 还 可 以 在 让 语句 后 添加 一 个 else 子 句 ， 这 样 形成 的 代码 用 于 表示 选择 执行 两 个 语句 
(或 语句 序列 ) 中 的 一 个 ， 具 体 执行 哪 一 个 取决 于 布尔 表达 式 是 true 还 是 false， 代 码 模板 如 
下 所 示 : 

if (< 布尔 表达 式 >》< 语 句 T> 

else < 语句 F> 

举 一 个 需要 else 语句 的 简单 例子 ， 考 虑 以 下 代码 ， 该 语句 将 两 个 int 值 中 最 大 的 那个 赋 
值 给 变量 max: 


if (x > y) max = Xx; 
else max = y; 


控制 流程 的 一 种 可 视 化 展示 方法 是 流程 图 。 流 程 图 中 的 路 径 对 应 于 程序 中 的 执行 流程 路 
径 。 在 计算 的 早期 ， 当 程序 员 使 用 低级 语言 和 难以 理解 的 控制 流程 时 ， 流 程 图 是 编程 的 一 个 
重要 部 分 。 在 现代 编程 语言 中 ， 我 们 使 用 流程 图 来 展示 论语 句 等 基本 语句 块 之 间 的 结构 。 


if (x < 0) x = -xi; if (x > y) max = x; 


else max = y; 
是 | 不 [= } 下 
G0) 
[x x] EEE 


流程 图 示例 ( 计 语 句 ) 


下 面 的 表格 包含 了 使 用 i 和 if-else 语句 的 例子 。 这 些 示例 是 完成 简单 计算 功能 的 典 
型 代码 ， 你 在 编写 程序 中 可 能 会 用 到 。 条 件 语 句 在 编程 中 是 很 重要 的 部 分 。 由 于 这 些 语 
句 的 语义 ( 即 意 思 ) 和 它们 所 对 应 的 自然 语言 的 短语 很 相似 ， 因 此 你 可 以 快速 地 学 会 使 用 
它们 。 

程序 1.3.1 是 男 一 个 使 用 if-else 语句 的 例子 。 在 这 个 例子 中 ， 我们 模拟 了 硬币 翻转 的 场 
景 。 程序 的 主体 部 分 只 有 一 条 语句 ， 语 句 的 用 法 和 表格 例子 所 示 的 非常 类 似 , 但 是 需要 注意 
的 是 ， 这 个 程序 引入 了 一 个 值得 思考 的 哲学 问题 : 计算 机 程序 能 产生 一 个 随机 (random) 的 
数 吗 ? 当然 不 能 ， 但 是 计算 机 程序 可 以 产生 一 些 具 有 很 多 随机 数 特性 的 数字 。 


绝对 值 if (x< 0) x== 一 X; 
1f7(Wi yy 
{ 
将 较 小 的 值 放 在 x 中 ， Tnt ta 
将 较 大 的 值 放 到 y 中 Xx, =,Y; 
Yb 
} 
| if (x > y) max = x; 
yO else max = y; 
除法 的 错误 检查 if (den == 0) System.out.printin("Division by zero"); 
1 WY. 


else System.out.printin("Quotient = " + num/den); 





使 用 if 和 if-else 语句 的 典型 示例 


double discriminant = b*b — 4.0*c; 
if (discriminant< 0.0) 
{ 
System.out.printin("No real roots"); 
} 
else 
l 
System.out .print1ln((-b + Math.sqrt(discriminant))/2.0); 
System.out .print1ln((-b — Math.sqrt(discriminant))/2.0); 
} 


使 用 if 和 if-else 语句 的 典型 示例 ( 续 ) 


一 元 二 次 方程 的 错误 检查 























程序 1.3.1 ”翻转 硬币 


public class Flip 
小 
public static void main(String[] args) 
{ // 模拟 硬币 的 翻转 情况 
if (Math.random() < 0.5) System.out.printin("Heads"); 
else System.out.printin("Tails"); 
} 





这 个 程序 使 用 了 Math.random0 函 数 去 模拟 硬币 的 翻转 ， 每 次 运行 这 个 程序 ， 
将 会 打印 正面 或 者 反面 。 不 断 运行 这 个 程序 ， 会 得 到 一 个 硬币 翻转 的 序列 ， 这 个 
序列 与 你 通过 翻转 真实 的 硬币 得 到 的 序列 有 很 多 相同 的 属性 ， 但 是 它 并 不 是 一 个 
真正 的 随机 序列 。 


% java Flip 
Heads 
% java Flip 
Tails 
% java Flip 
Tails 


While 循环 ”很 多 计算 本 质 上 是 重复 的 ， 对 于 这 类 计算 ，Java 使 用 下 面 的 基本 结构 进行 处 理 : 
while (< 布尔 表达 式 >) { < 语句 > } 


while 语句 与 让 语句 具有 相同 的 形式 (唯一 的 区 别 是 使 用 关键 字 while 而 不 是 if)， 但 是 
其 含义 却 大 不 相同 。while 语句 向 计算 机 发 出 的 指令 如 下 : 如 果 布 尔 表达 式 为 false， 则 不 执 
行 任何 操作 ; 如 果 布 尔 表 达 式 为 true， 则 执行 语句 序列 (就 像 使 用 让 语句 一 样 )， 接 着 再 次 
检查 布尔 表达 式 ， 如 果 表 达 式 为 ttue， 则 再 次 执行 语句 序列 ， 即 只 要 表达 式 为 tue， 就 不 断 
地 继续 执行 。 我 们 将 循环 中 的 语句 块 称 为 循环 的 主体 。 与 让 语句 一 样 ， 如 果 while 循环 体 只 
有 一 个 语句 ， 则 大 括号 是 可 以 省 略 的 。while 语句 相当 于 一 系列 相同 的 让 语句 : 

if (< 布尔 表达 式 >) { < 语句 > } 


if (< 布尔 表达 式 >) { < 语句 > } 
if (< 布尔 表达 式 >) { < 语句 > } 


在 某 点 下 ， 其 中 一 个 语句 中 的 代码 会 改变 一 些 内 容 (如 布尔 表达 式 中 某 个 变量 的 值 )， 
使 布尔 表达 式 为 false， 则 语句 序列 的 执行 被 中 断 。 


32 党 不 但 


常见 的 while 语句 的 编程 用 法 中 会 维护 一 个 整数 值 ， 以 跟踪 循环 迭代 的 次 数 。 我 们 从 初 
始 化 好 的 某 个 值 开始 ， 然 后 每 次 循环 时 将 值 增加 1， 在 决定 是 否 继续 之 前 需要 测试 它 是 否 超 
过 预定 的 最 大 值 。TenHellos (程序 1.3.2 ) 就 是 使 用 while 语句 范例 的 一 个 简单 例子 ， 其 中 的 
关键 语句 是 


T=si+1; 
作为 一 个 数学 方程 式 ， 这 个 语句 是 没有 任何 意义 的 ,但 是 在 Java 赋值 语句 中 它 的 意义 非常 
清晰 : 先 计算 出 it1 的 值 ， 然 后 将 计算 出 的 结果 赋值 给 变量 i。 如 果 计 算 前 i 变量 的 值 是 4， 
那么 计算 后 i 的 值 是 5 ; 如 果 i 是 5， 则 变 成 6， 等 等 。 在 TenHellos 程序 中 i 的 初始 值 是 4， 
循环 体 在 执行 结束 前 执行 了 7 次， 而 i 的 值 变 成 了 11。 






程序 1.3.2 ”第 一 个 while 循 环 语句 







public class TenHe11os 
{ 


public static void main(String[] args) 
{ /A 打印 了 十 次 He11o 






System.out.println("1st Hello"); 

System.out.printin("2nd Hello"); 

System.out.println("3rd Hello"); 

int 1 = 4; 

while (i <= 10) 

{ ZX 打印 第 i 次 He1lo 
System.out.println(i + "th Hello"); 

1 













该 程序 使 用 while 循 环 来 简单 、 重 复 地 打印 提示 信息 ， 运 行 效果 如 下 所 示 。 
在 第 三 行 之 后 ， 每 次 要 打印 的 信息 差异 仅 是 该 行 的 索引 值 ， 因 此 我 们 设置 一 个 
变量 用 于 表示 该 索引 。 首 先 将 i 初始 化 为 4， 然 后 进入 一 个 while 循 环 ， 我 们 在 
System.out.printin() 语 句 中 使 用 的 值 ， 并 且 在 每 个 循环 中 增加 它 。 打 印 第 10 个 
Hello 后 ，i 的 值 为 11 ,循环 结束 。 




















% java TenHellos 7 7 <= 10 output 
村 4 true 4th Hello 
2nd Hello 
| 3rd Hello 5 true 5th Hello 
4th Hello 6 true 6th Hello 
TS 7 true 7th Hello 
th Hello 
7th Hello 8 true 8th Hello 
8th Hello 9 true 9th Hello 
9th Hello 1 true 10th Hello 


10th Hello 





11 false 


Trace of java TenHellos 





对 于 这 个 简单 的 任务 ， 使 用 while 循环 几乎 没有 什么 价值 ， 但 是 你 很 快 就 要 解决 一 些 复 
杂 的 任务 ， 你 需要 将 一 些 语句 重复 执行 非常 多 次 ， 以 至 于 在 没有 循环 的 情况 下 无 法 完成 这 些 
任务 。 程 序 之 间 有 无 while 语句 有 着 很 大 的 区 别 ， 因 为 while 语句 允许 我 们 在 程序 中 不 限 次 
数 地 执行 特定 的 语句 。 借 助 while 语句 ， 我 们 可 以 在 短程 序 中 实现 宛 长 的 计算 。 这 种 能 力 打 


编程 元 丙 33 


开 了 编写 程序 的 大 门 ， 而 这 些 任务 是 我 们 在 没有 计算 机 的 情况 下 无 法 解决 的 。 但 也 有 一 个 代 
价 : 随 着 程序 越 来 越 复杂 ， 它 们 变 得 越 来 越 难以 理解 。 


int 1 = 4; 
while (i <= 10) 
{ 


System.out.printin(i + "th Hello"); 
1=1+1; 


} 










变量 初始 化 是 
一 个 单独 的 语句 循环 继续 
时 


int power = 1; 


while ([power <= n/2|) 


当 循环 是 单个 语 ,x 3 
句 时， 大 括号 是 、、 
可 以 省 略 的 。“} t 
循环 体 
一 个 while 循环 的 剖析 流程 图 示例 (while 循环 ) 


程序 PowersOfTwo (程序 1.3.3 ) 使 用 一 个 while 循环 打印 出 2 的 寡 的 表格 。 除 了 循环 控制 
计数 器 i 之 外 ， 它 使 用 了 一 个 变量 power 来 保存 2 的 寡 的 值 。 循 环 体 包含 三 个 语句 : 一 个 用 于 打 


印 2 的 当前 寡 ， 一 个 用 于 计算 下 一 个 寡 (将 当前 值 乘 以 2 )， 另 一 个 用 于 递增 循环 控制 计数 器 。 | 池 
56 


程序 1.3.3 “计算 2 的 寡 





public class PowersOfTwo 


{ 





public static void main(String[] args) n 循环 终止 的 变量 

{ AM 打印 2 的 前 n 次 篆 i | 循环 控制 计数 器 
int n = Integer.parseInt(args[0]); power | 当前 循环 计算 的 2 的 星 
int power = 1; 













int i = .0; 

while (i <= n) 

{ // 打印 第 i 个 2 的 老 
System.out.println(i + " " + power); 
power = 2 * power; 

i=1i+1; 








该 程序 需要 输入 整 型 命令 行 参数 +?， 并 打印 一 个 小 于 或 等 于 2" 的 2 的 徊 
的 表格 。 每 一 次 循环 中 都 会 增加 变量 ;的 值 ， 同 时 将 power 变 量 增加 两 倍 。 
我 们 仅 展 示 表 格 中 前 三 行 和 最 后 三 行 ， 实 际 上 程序 会 打印 n+1 行 。 





% java PowersOfTwo 29 
01 
biz 
24 


27 134217728 
28 268435456 
29 536870912 






在 计算 机 中 有 许多 情况 需要 用 到 2 的 备 方 。 你 需要 熟练 地 记 住 表格 中 的 前 10 个 值 ， 也 需要 


34 : 尖 必 洒 


注意 一 些 有 意思 的 数据 ， 如 2" 在 1000 (K) 左右 ，22 大 约 是 100 万 (M)，2” 大约 是 十 亿 (B)。 
以 PowersOfTwo 为 原型 ， 还 可 以 做 出 很 多 其 他 的 计算 模型 ， 





| power Vice hh 

通过 改变 累积 值 的 计算 方法 和 循环 控制 量 递增 的 方式 ， 我 们 可 以 。 1 true 
打印 出 很 多 种 函数 的 取 值 表 〈 详 见 练习 1.3.12 )。 
为 了 检查 程序 运行 中 的 行为 ， 需 要 仔细 分 析 它 的 执行 3 8 true 
轨迹 ， 这 种 技术 叫 作 程序 跟踪 ， 是 非常 有 意义 的 。 例 如 跟踪 4 16 true 
PowersOfTwo 程序 ， 就 是 在 每 次 循环 前 输出 每 个 变量 的 值 以 及 控 本 
制 循环 的 布尔 表达 式 的 值 。 跟 踪 循环 的 操作 可 能 非常 烦琐 ， 而 且  ， 2 2 
会 输出 大 量 的 信息 ， 但 是 跟踪 通常 是 很 有 价值 的 ， 因 为 它 可 以 清 8 256 i 
晰 地 展示 程序 每 一 步 的 操作 。 9 512 true 


PowersOfTwo 基本 上 是 一 个 自我 跟踪 的 程序 ， 因 为 它 通 过 循 me ei 

环 来 打印 它 的 变量 的 值 。 显 然 ， 你 可 以 在 程序 中 通过 System.out. 12 4096 疡 泊 
println() 语句 来 跟踪 程序 。 现 代 编 程 环 境 提供 了 更 加 复杂 的 跟踪 “33 8192 true 
工具 ,但 是 使 用 输出 语句 ( Print) 这 种 方法 更 加 简单 有 效 ， 也 非 Ri 

常 可 靠 。 你 可 以 在 循环 程序 中 都 加 入 print 语句 ， 以 保证 它们 都 1 65536 a 

精准 地 执行 了 你 期 望 的 操作 。 17 131072 true 
在 PowersOfTwo 程序 中 有 一 个 隐藏 的 陷阱 ， 因 为 Java 中 最 1 262144 true 


大 的 int 数据 是 23-1， 但 程序 并 没有 检测 到 达 这 种 边界 值 的 情 加 和 Te 


20 1048576 true 

况 ， 如 果 运 行 java PowersOfTwo 31， 你 可 能 会 发 现 最 后 一 行 的 ”21 ” 2097152 SR 
打印 输出 与 你 想象 的 不 同 : 22 4194304 true 
23 8388608 true 

1073741824 24 16777216 true 
-2147483648 25 33554432 true 


26 67108864 true 


基于 Java 表示 整数 的 方式 ， 变 量 power 变 得 太 大 后 会 呈现 负 Mt a ie 
值 。 在 Java 中 可 以 用 的 int 型 最 大 值 是 IntegerMAX VALUE,; 你 可 28 268435456 true 
以 用 它 来 检测 数据 是 否 发 生 溢出 。 例 如 ， 可 以 改进 程序 1.3.3, 当 用 ?9 536870912 true 
户 输入 的 值 过 大 时 ， 可 以 输出 一 个 错误 消息 。 实 际 上 ， 要 想 让 你 的 ”Ye 
程序 对 于 所 有 可 能 的 输入 都 产生 正常 工作 结果 ， 需 要 做 的 工作 要 远 ee 
比 想象 的 复杂 。( 对 于 类 似 的 挑战 ， 请 参阅 练习 1.3.16。) 

举 一 个 复杂 一 点 的 例子 ， 假 设 你 想 要 计算 出 小 于 或 等 于 给 定 - | 
正 整 数 n 的 最 大 的 2 的 需 值 ， 即 如 果 n 是 13， 我 们 想 要 的 结果 就 
是 8; 如 果 n 是 1000， 那 么 我 们 想 要 的 结果 是 512; 如 果 m 是 64， 
我 们 想 要 的 结果 是 64， 等 等 。 该 计算 可 以 使 用 while 循环 来 实现 : 

int power = 1; 


while (power <= n/2) 
power = 2*power; 


你 需要 花 一 些 时 间 思 考 才 能 说 服 自己 ， 这 段 简单 的 代码 真 的 


友 










产生 了 期 望 的 结果 ， 可 以 通过 观察 来 做 到 这 一 点 : 语句 的 流程 图 
。power 变量 的 人 水 运 是 2 的 和 SR 
。power 变量 的 值 不 可 能 比 n 大。 power = 2*power; 


。 power 变量 的 值 在 每 次 循环 中 都 会 增加 ， 所 以 循环 一 定 会 终止 。 


。 在 循环 终止 后 ，2*power 的 值 会 大 于 n。 

推理 这 样 的 程序 是 如 何 工 作 的 ， 对 于 理解 while 循环 的 工作 原理 往往 非常 重要 。 即 便 你 编写 
的 很 多 循环 可 能 比 这 个 简单 ， 你 也 需要 确保 在 每 次 循环 过 程 中 你 所 写 的 代码 能 够 按照 期 望 运行 。 

循环 运行 的 次 数 可 多 可 少 ， 如 程序 TenHellos 中 只 运行 了 几 次 ， 在 PowersOfTwo 中 运 
行 几 十 次 ,我 们 即将 探讨 的 几 个 例子 可 能 要 运行 几 百 万 次 。 无 论 循环 迭代 多 少 次 ， 以 及 循环 
体 的 大 小 ， 这 些 语 句 背 后 的 逻辑 是 相同 的 。 当 我 们 写 循环 时 ， 至 关 重 要 的 是 要 理解 每 次 循环 
中 变量 的 变化 。 在 编程 的 初期 ， 你 可 以 令 循 环 语 句 运行 少量 的 迭代 次 数 ， 并 添加 输出 语句 来 
跟踪 这 些 变 量 的 值 以 检查 你 的 理解 是 正确 的 。 当 你 熟练 以 后 ， 就 可 以 彻底 丢弃 这 些 初学 者 的 
辅助 工具 ， 写 出 复杂 的 循环 ， 从 而 真正 释放 计算 机 的 能 力 。 

for 循环 在 后 面 的 学 习 中 我 们 会 看 到 ， 利 用 while 循环 能 够 编写 出 各 种 应 用 程序 。 在 
继续 学 习 更 多 例子 前 ， 我 们 来 学 习 另 外 一 个 Java 结构 ， 以 通过 更 加 灵活 的 方式 编写 循环 。 
这 个 结构 和 基本 的 while 循环 在 原理 上 没有 什么 不 同 ， 但 是 使 用 得 更 加 广泛 ， 因 为 这 种 方式 
相 比 只 用 while 语句 书写 的 代码 更 加 紧凑 ， 可 读 性 更 好 。 

声明 并 初始 化 一 


在 循环 开始 之 前 个 循环 控制 变量 
初始 化 其 他 变量 继续 循 
环 的 条 件 增 量 
int power\= 1; | 和 型 : 
for (int 1 = OF [Fe nk fst]) 
{ 
System.out.printin(i + " " + power); 
power = 2*power; 





} f 
循环 体 
for 循环 的 剖析 (用 于 打印 2 的 宕 ) 

for 语句 。 很 多 循环 遵从 这 种 形式 : 将 一 个 索引 变量 初始 化 为 某 个 值 ， 接 着 使 用 while 
循环 测试 循环 条 件 是 否 成 立 ， 循 环 条 件 往往 是 关于 索引 变量 的 判断 ，while 循环 的 循环 体 中 
最 后 一 个 语句 用 于 递增 索引 变量 。 你 也 可 以 直接 用 Java 中 的 for 语句 来 表示 这 样 的 循环 : 

et hire 

、 < 循环 体 语句 > 


这 段 代 码 在 绝 大 多 数 情况 下 都 可 以 等 价 于 下 面 的 代码 : 


< 初始 化 >; 
while (< 布尔 表达 式 >) 
{ 


< 循环 体 语句 > 
< 递增 >; 
} [59 | 
你 的 Java 编译 器 甚至 可 以 为 这 两 种 循环 的 写法 产生 相同 的 执行 代码 。 实 际 上 ，< 初始 化 > 
和 < 递增 > 部 分 可 以 是 更 复杂 的 语句 ， 但 我 们 几乎 总 是 使 用 for 循环 来 实现 这 种 典型 的 “初始 
化 - 增 量 ”的 编程 模式 。 例 如 ， 以 下 两 行 代码 等 同 于 TenHellos (程序 1.3.2 ) 中 相应 的 代码 行 : 


for (Cint 1 = 4; .1 <= 10; 1 = 1 + 1) 
System.out.println(i + "th Hello"); 


通常 情况 下 ， 我 们 还 会 把 这 些 代 码 写 得 更 加 简洁 ， 这 需要 用 到 一 些 快捷 的 表示 方法 ， 我 
们 下 面 来 学 习 它 们 。 

复合 赋值 语句 。 修 改 一 个 变量 的 值 是 编程 中 常见 的 事情 ， 在 Java 中 提供 了 各 种 各 样 的 
简写 符号 以 实现 这 些 功 能 。 例如， 以 下 四 种 语句 可 以 实现 将 i 的 值 增加 1: 


1 二 二 1T++; ++1; 1 += 1; 


类 似 地 ,i--、--i 或 者 i-=1、i=i-1 实现 将 i 的 值 减 1。 大 部 分 程序 员 在 for 循环 中 使 
用 计 + 或 者 i--。++ 或 者 -- 结构 通常 只 能 应 用 于 整数 ， 而 复合 赋值 (compound assignment) 
结构 可 以 用 于 任何 基本 数字 类 型 的 算术 运算 符 操 作 。 例 如 ， 我们 用 power *= 2 或 者 
power += power 来 代替 power = 2 * power。 所 有 这 些 语法 都 只 是 为 了 符号 方便 而 提供 的 ， 没 
有 什么 特殊 的 意义 。 这 些 快 捷 的 代码 书写 方式 在 20 世纪 70 年 代 被 C 编程 语言 广泛 使 用 ， 
并 已 成 为 标准 。 它 们 经 历 了 时 间 的 考验 ， 因 为 它们 是 紧凑 、 优 雅 、 易 于 理解 的 方案 。 当 你 学 
会 了 编写 (和 阅读 ) 与 这 些 符号 相关 的 程序 时 ， 你 会 发 现 许 多 现代 语言 编程 中 都 在 使 用 这 样 
的 书写 形式 ， 而 不 仅仅 是 Java。 

作用 域 。 变 量 的 作用 域 (scope) 是 程序 中 能 够 通过 名 称 来 指向 这 个 变量 的 代码 区 域 。 一 
般 而 言 ， 变 量 的 作用 域 是 与 变量 声明 在 同一 个 块 中 的 声明 语句 后 面 的 语句 。 为 此 ，for 语句 
的 前 导 部 分 代码 ( 即 for 语句 中 的 初始 化 、 布 尔 表达 式 、 递 增 三 个 区 域 的 代码 一 一 译 者 注 ) 
被 认为 与 for 循环 体 在 同一 个 块 中 。 因 此 ，while 循环 和 for 循环 并 不 完全 相同 : 在 典型 的 
for 循环 中 ， 增 量变 量 不 能 用 于 后 面 的 语句 中 ， 而 在 对 应 的 while 循环 中 可 能 会 用 到 。 这 种 
细微 的 区 别 通 常 是 使 用 while 循环 而 不 是 for 循环 的 原因 。 

完成 同一 个 计算 任务 ， 有 多 种 不 同 的 实现 方式 可 以 选择 ， 至 于 选择 哪 一 种 ， 则 是 程序 员 
的 个 人 爱好 问题 ， 就 如 同 作 家 在 同义词 中 进行 挑选 ， 或 者 是 决定 句子 使 用 主动 语 态 还 是 被 动 
语 态 的 问题 。 关 于 如 何 编写 一 个 程序 ， 你 不 会 找到 简单 高 效 的 硬性 规定 ， 就 像 你 不 可 能 找到 
一 个 规则 教 你 如 何 写 好 小 说 一 样 。 你 的 目标 应 该 是 寻找 适合 你 的 风格 一 一 既 能 完成 计算 和 编 
程 任务 ， 又 可 以 被 其 他 人 所 欣赏 。 

下 面 的 表格 中 包含 了 几 个 在 Java 中 常用 的 循环 代码 片段 ， 其 中 二 些 代码 与 前 面 讲 到 的 
编程 示例 相关 ， 还 有 一 些 是 全 新 的 代码 ， 用 来 实现 简单 而 直接 的 计算 任务 。 为 了 巩固 你 对 
Java 循环 的 理解 ， 你 可 以 自己 找 一 些 计算 任务 并 用 循环 语句 来 解决 它们 ， 或 者 试 着 完成 本 节 
末 的 练习 中 的 前 面 一 部 分 。 运 行 你 自己 编写 的 代码 所 获得 的 经 验 是 其 他 方式 不 可 替代 的 ， 你 
必须 了 解 如 何 编写 Java 的 循环 代码 。 


int power = 1; 





计算 小 于 或 等 于 while (power<= n/2) 
n 的 最 大 的 2 的 客 power = 2*power; 
System.out .print1ln(Cpower ) ; 
int sum = 0; 
计算 有 限 个 整数 的 和 for (int 1 = 1; 1<= n; 1+4+) 
(1+2+:"…+4Nn) sum += i1; 


System.out .print1in(sum); 











int product = 1; 
计算 有 限 个 整数 的 积 (阶乘 ) for (int 1 = 1; i<=,n; i++) 
(nlsl1 X2X "Xn ) product *= i; 
System.out.printin(product ); 





使 用 while 和 for 循环 的 典型 示例 
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for (int i = 0; i<= n; i++) 


问 一 人 EE 3 
打印 一 个 函数 值 表 System out :printinC tos 2nMath .PLIalXn)s 





String ruler = "1"; 
for (int 1 = 2;. 1<= n; i++) 

Puners ruler Pp ruUTer; 
System.out .printin(ruler); 


使 用 while 和 for 循环 的 典型 示例 ( 续 ) 


嵌 套 让、while 和 for 语句 与 Java 中 的 赋值 语句 或 者 任何 其 他 语句 在 编程 时 地 位 是 对 等 
的 ， 也 就 是 说 这 些 语句 都 可 以 出 现在 任何 需要 的 地 方 ， 对 于 位 置 没 有 特殊 的 要 求 。 特 别 需 要 
说 明 的 是 ,我们 可 以 把 它们 中 的 一 名 或 者 多 句 用 在 另 一 个 语句 块 中 ， 当 作 语 名 的 一 部 分 ， 从 
而 形成 复合 语句 ( compound statement)。 我 们 来 看 一 个 例子 ， 程 序 DivisorPattern (程序 1.3.4 ) 
有 一 个 for 循环 ， 而 for 循环 的 循环 体 里 面 还 包含 一 个 for 循环 〈 嵌 套 的 for 循环 体 里 包含 的 是 
一 个 if-else 语句 ) 和 二 个 print 语 句 。 这 个 程序 用 于 打印 一 个 由 星 号 组 成 的 图 案 ， 在 第 i 行 中 ， 
如 果 列 号 能 够 整除 i 或 者 被 i 整除， 那么 这 个 位 置 会 有 一 个 星 号 (这 个 规律 同样 适用 于 列 )。 


计算 标尺 函数 
( 见 程序 1.2.1 ) 


程序 1.3.4 ”你 的 第 一 个 谋 套 循环 程序 


public class DivisorPattern 


ae 生 n | 行 和 列 的 数目 
public static void main(String[] args) | | 行 的 索引 值 
{ // 输出 一 个 正方 形 以 表示 整除 的 数字 > 
int n = Integer.parseInt(args[0]); j | 列 的 索引 值 


for (Cint 1 = 1; 1 <= n; i++) 
{ /7 输出 第 i 行 
for (int j= 1; j <= Nn; j++) 
{ // 输出 第 i 行 的 第 j 列 元 素 
if ((i %j == 0) || (j % i == 0)) 
System.out.print("* "); 
else 
System:out,print(” "); 


System.out.println(i); 


“这 一 个 程序 要 求 答 入 命令 参数 v， 然 后 用 诺 套 循环 打印 一 个 ij 表格 ， 
对 于 表格 中 的 第 i; 行 第 j 列 ， 如 果 i 除 以 j 或 者 是 j 除 以 i 余数 是 0， 就 在 第 i 行 


第 / 列 上 打印 星 号 。 
5: fot ee 3 了 jj 林 克 7 输出 
有 和 SP 主 0 0 
i 0 * 
ae 2 有 
本 于 | 2 1 
斋 宙 和 妇 夫 了 3 2 工 0 1 覃 
加 安 次 站 2 0 0 
时 5 2 3 2 1 
窜 穴 突 * 6 2 
7 旋光 要 0 1 
凌 实 次 奖 8 3 3 1 2 
Ts - 9 3 Ey -CE 0 
实 次 袜 次 10 3 
局 » ll 
安安 安安 穴 * 12 | 命令 行 参数 输入 3 时 


DivisorPattern 和 程序 跟踪 信息 
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为 了 使 贬 套 更 加 清晰 ， 我 们 在 程序 代码 中 使 用 缩 进 。 将 i 循环 称 为 外 部 循环 ， 将 j 循环 
称 为 内 部 循环 。 外 部 循环 每 迭代 一 次 ， 内 部 循环 都 需要 执行 一 整 次 循环 ( 即 把 内 部 循环 的 循 
环 控制 变量 从 初始 化 递增 到 循环 结束 译 者 注 )。 通 常 ， 了 解 这 样 一 个 新 的 编程 结构 的 最 
好 方法 是 研究 程序 的 跟踪 信息 以 明确 每 一 步 的 迭代 过 程 。 

DivisorPattern 的 控制 流程 更 加 复杂 ， 你 可 以 从 它 的 控制 流程 图 中 看 出 来 。 通 过 这 个 图 
我 们 可 以 清楚 地 认识 到 ， 使 用 数量 有 限 的 简单 控制 流程 结构 在 编程 过 程 当中 是 至 关 重 要 的 。 
使 用 蔚 套 的 方法 ， 即 便 程 序 的 流程 图 很 复杂 ， 你 也 可 以 构建 出 非常 容易 理解 的 循环 结构 和 判 
断 语 句 。 只 需要 一 个 或 者 两 个 瞬 套 就 可 以 完成 很 多 有 用 的 计算 ,你 将 会 看 到 ， 书 中 的 许多 程 
序 都 与 DivisorPattern 具有 相同 的 结构 。 









臣 


党 
是 (Ciwj 一 0 || dxi0? 


System,.out.print("* "); Be System.out.print(” "); 


System,.out.println(i); 






DivisorPattern 的 控制 流程 图 
关于 内 套 的 第 二 例子 ， 我 们 来 看 以 下 程序 片段 ， 这 是 一 段 用 于 计算 所 得 税率 的 程序 : 
if (income < 0) rate = 0.00; 


else if (income < 8925) rate = 0.10; 

else if (income < 36250) rate = 0.15; 

else if (income < 87850) rate = 0.23; 

else if (income < 183250) rate = 0.28; 

else if (income < 398350) rate = 0.33; 

else if (income < 400000) rate = 0.35; 

else rate =, 0.396; 

在 这 个 例子 中 ， 多 个 让 语句 向 套 在 一 起 ， 实 现在 多 个 互 斥 条 件 中 进行 判断 。 这 种 结构 
是 一 种 特殊 的 写法 , 但 是 我 们 经 常 使 用 。 通 常情 况 下 ， 在 向 套 让 语句 时 最 好 使 用 花 括号 来 
消除 歧义 。 关 于 这 个 问题 我 们 会 在 问答 环节 继续 讨论 ， 在 练习 中 也 会 有 更 多 的 例子 。 

应 用 “一 且 掌 握 了 使 用 循环 编写 程序 的 能 力 ， 你 就 立刻 打开 了 整个 计算 世界 的 大 门 。 为 
了 证 明 这 一 点 ， 接 下 来 的 例子 中 我 们 会 分 析 来 自 不 同 领域 的 计算 任务 ， 并 用 编程 来 解决 问 
题 。 这 些 例 子 只 用 到 了 我 们 在 1.2 节 中 讲 到 的 数据 类 型 ， 但 请 放心 ， 相 同 的 机 制 可 以 为 任何 
计算 应 用 提供 良好 的 效果 。 这 些 示 例 程序 是 经 过 精心 研究 的 ， 通 过 研究 它们 ， 你 可 以 更 好 地 
写 出 自己 的 循环 程序 。 

我 们 在 这 里 涉及 的 例子 都 是 包含 了 一 定 运算 量 的 。 这 几 个 例子 与 过 去 几 个 世纪 数学 家 
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和 科学 家 面临 的 问题 有 关 。 虽 然 计算 机 已 经 存在 了 70 多 年 ， 但 是 我 们 程序 中 使 用 的 很 多 计 
算 方法 还 是 基于 古老 的 传统 数学 方法 ， 有 些 方法 甚至 可 以 追溯 到 古代 。 

计算 有 限 数 和 。PowersOfTwo 程 序 是 一 个 很 好 的 程序 
模板 ， 你 在 编程 中 可 能 会 经 常 使 用 到 。 它 使 用 两 个 变量 ， 一 
个 用 作 控 制 循环 的 索引 值 ， 另 一 个 用 于 累加 计算 结果 。 程 序 
HarmonicNumber (程序 1.3.5， 即 用 于 计算 谐 波 数 一 一 译 者 注 ) 
使 用 的 就 是 这 个 模板 ， 以 计算 有 限 个 数字 的 和 到 =1+1/2+1/3+… 
+1/n。 这 些 数字 通常 称 为 谐 波 数 ( harmonic number)， 在 离散 数 1/4 
学 中 会 经 常用 到 。 谐 波 数 是 对 数 函 数 的 离散 模拟 ， 也 可 以 用 于 近 
似 计算 y=1/x 曲线 下 的 面积 。 你 也 可 以 使 用 程序 1.3.5 作为 模板 
来 计算 其 他 有 限 个 数字 的 和 ( 见 练习 1.3.18 ) 。 


程序 1.3.5” 谐 波 数 (一 ) 


-hs class HarmonicNumber n | 用 于 求 和 的 数字 的 个 数 
public static void main(String[] args) i | 循环 索引 
{ YL 计算 第 n 个 谐 波 数 sum | 罕 加 结果 


int n = Integer.parseInt(args[0]); 
double sum = 0.0; 
for Cint 1 = 1; i1 <= ni i++) 
{ // 将 第 1 项 添加 到 总 和 中 
sum += 1.0/i; 
4 


System.out.printin(sum); 


“这 个 程序 要 求 输入 一 个 int 型 的 命令 行 参数 v， 然 后 计算 第 * 个 谐 波 数 的 
值 。 从 数学 角度 分 析 ， 对 于 n 值 较 大 的 情况 , 谐 波 数 的 值 大 约 是 In(n)+0.57721: 
注意 ，jz(1 000 000)+0.577 21=14.392 72。 


% java HarmonicNumber 2 % java HarmonicNumber 10000 
Ys 7.485470860550343 

% java HarmonicNumber 10 % java HarmonicNumber 1000000 
2.9289682539682538 14.392726722864989 





计算 平方 根 。Java 中 的 Math 库 (数学 库 ) 是 如 何 实现 的 ? :我们 来 研究 平方 根 函 数 Math. 
sqrt()。 程 序 Sqrt (程序 1.3.6 ) 展示 了 一 种 实现 方法 。 这 段 程序 的 
计算 方法 使 用 的 是 4000 年 前 巴比伦 人 所 提出 的 迭代 计算 方法 。 这 
种 算法 也 是 17 世纪 由 Isaac Newton 和 Joseph Raphson 开发 的 通用 
求 平方 根 方法 的 特殊 形式 ， 因 此 也 称 为 牛顿 法 。 在 一 般 情况 下 ， 
牛顿 法 可 以 用 于 求解 给 定 函 数 ftx) 的 根 ， 即 ftx) 值 为 0 时 ,x 的 值 。 
对 于 某 个 估计 值 ,通过 在 点 (t,t)) 处 绘制 与 曲线 y=ftx) 相 切 的 
线 ， 并 将 该 切线 与 x 轴 的 交点 记 为 1，tini 就 是 新 的 估计 值 。 从 最 el 
初 的 估计 值 开 始 ,不 断 迭 代 这 个 过 程 ， 就 会 越 来 越 接 近 函 数 牛顿 法 
的 根 。 





程序 1.3.6“ 牛 顿 法 





public class Sqrt 


1 | 全数 


| EPSILON | 误差 容忍 度 | 
double c = Double.parseDouble(args[0]); 1 S < 的 平方 根 的 估计 
double EPSILON = le-15; SE ae ， 
double t = ci; 
while (Math.abs(t - c/t) > EPSILON * 七 ) 
{ /N 用 +t 和 c 人 t 的 平均 值 来 代替 七 
ta A t/a 0 


public static void main(String[] args) 


System.out.print1n(t); 
} 
事 








该 程序 使 用 正 的 浮 点 数 c 作 为 命令 行 参数 ， 并 使 用 牛顿 法 计算 < 的 
平方 根 ， 精 度 计算 到 小 数 点 后 15 位 。 


% java Sqrt 2.0 i 迭代 CA 
1.414213562373095 | 2.0000000000000000 1.0 
% java Sqrt 2544545 由 1.5000000000000000 1.3333333333333333 
1595.1630010754388 

1.4166666666666665” 1.4117647058823530 
1.4142156862745097 1.4142114384748700 
1.4142135623746899 1.4142135623715002 
1.4142135623730950 1.4142135623730951 

java Sqrt 2.0 的 跟踪 信息 


nm 


计算 一 个 正 数 c 的 平方 根 等 同 于 找到 函数 Ko)=z2-c 的 一 个 正 根 。 程 序 Sqrt 就 是 牛顿 法 
在 这 种 特殊 情形 下 的 代码 实现 (完整 的 实现 见 练习 1.3.19 )。 从 估 值 二 c 开始 ， 如 果 1 等 于 oc/t， 
那么 t 就 等 于 c 的 一 个 平方 根 ， 这 样 计算 就 结束 了 。 如 果 不 相等 ,那么 用 t 和 c/t 之 间 的 平均 
值 来 替代 我 们 之 前 的 估 值 上 使 用 牛顿 法 ， 我 们 求 得 一 个 值 的 平方 根 仅仅 只 需要 5 次 循环 迭 
代 ， 结 果 可 以 精确 到 小 数 点 后 的 15 位 。 

牛顿 法 在 科学 计算 当中 非常 重要 ， 因 为 求 根 问题 是 广泛 存在 的 ;而 类 似 的 迭代 方法 在 这 
些 问题 中 也 是 有 效 的 。 甚 至 许多 还 没有 从 分 析 的 角度 找到 求解 方法 的 问题 也 可 以 用 牛顿 法 求 
解 。 同 样 ， 在 Java 的 Math 库 中 没有 提供 支持 的 数学 函数 也 可 以 这 样 求解 。 有 了 这 个 方法 和 
计算 机 的 计算 能 力 ， 我 们 认为 可 以 找到 任何 我 们 需要 的 函数 的 值 ;而 在 计算 机 出 现 之 前 ， 科 
学 家 和 工程 师 不 得 不 使 用 查 表 法 或 手动 计算 。 为 了 使 手动 计算 尽 可 能 高 效 ， 人 们 提出 了 多 种 
计算 技术 和 方法 ， 当 我 们 使 用 计算 机 时 ， 这 些 技术 和 方法 可 以 更 加 高 效 地 发 挥 作用 。 和 牛顿 法 
就 是 一 个 典型 的 例子 。 计 算数 学 函数 值 的 另 一 个 有 用 的 方法 是 使 用 泰勒 级 数 展开 (参见 练习 
1.3.37 和 练习 1.3.38 ) 。 

数 制 转换 。 程 序 Binary (程序 1.3.7 ) 能 够 将 命令 行 参 数 输入 的 十 进 制 数字 转换 为 二 进 
制 (基数 为 2) 并 打印 出 来 。 它 的 方法 是 将 一 个 数 分 解 为 若干 个 2 的 寡 的 和 。 例 如 ，19 的 二 
进 制 表示 为 10011， 也 就 意味 着 19=16+2+1 (19=24+2!+20 )。 为 了 计算 n 的 三 进 制 表示 ， 我 
们 需要 计算 出 所 有 小 于 或 等 于 n 的 2 的 窜 值 ， 将 它们 按 降序 排列 ， 用 以 确定 哪些 可 以 用 于 二 
进 制 分 解 ( 被 采用 的 值 ， 对 应 三 进 制 表 示 中 相应 的 位 为 1)。 这 个 过 程 相当 于 使 用 天 平 来 称 
量 一 个 物体 ， 使 用 重量 是 2 的 寡 的 硅 码 ， 首 先 我 们 找到 不 超过 物体 的 最 大 的 夸 码 。 然 后 ， 按 
照 递 减 的 顺序 考虑 硅 码 ， 我 们 每 添加 一 个 夸 码 即 测试 是 否 超过 物体 的 重量 ， 如 果 是 ， 则 我 们 
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拿 掉 夸 码 ， 否 则 我 们 留 下 硅 码 ， 并 尝试 下 一 个 硅 码 。 每 一 个 夸 码 对 应 的 是 对 象 重量 的 二 进 
制 表示 中 的 一 位 。 如 果 移 除 硅 码 ， 那 么 对 应 物体 重量 的 二 进 制 位 的 表示 是 0。 


小 于 16+8 小 于 16+4 
大 于 16 + + 
1022? 100?? 
3 Ea We 
16 兴 <24 | <20 
T1642 等 于 16+2+1 


. pi 唤 10011 


10000+10+1 = 10011 
利用 天 平 模拟 二 进 制 转换 










程序 1.3.7 “二进制 转换 









es class Binary 待 转换 的 整数 
power | 当前 2 的 客 

















public static void main(String[] args) 
{ VW 打印 i 的 叶 进 制 表 示 

int n = Integer.parseInt(args[0]); 
int power = 1; 
while (power <= n/2) 


power = 2*power; 
// 现在 的 甘 值 是 / 人 于 或 等 于 n 的 最 大 的 2 的 短信 
while (power > 
3 /4 再 中 乔 交 2 的 时 
if (Cn < power) { System.out.print(0) ; 
else { System.out.print(1); n -= power; } 
power /= 2; 





System.out.println0); 
















该 程序 要 求 命令 行 参数 输入 正 整数 "， 
的 就 是 书 中 讲 到 的 降序 排列 2 的 等 的 方法 。 


然后 打印 z 的 二 进 制 表示 ， 使 用 





% java Binary 19 
10011 

% java Binary 1 
101111101011110000100000000 







在 Binary 程序 中 ， 变 量 power 代表 的 是 当前 已 经 尝试 过 称 重 的 夸 码 ， 而 变量 mn 代表 的 
是 超出 夸 码 重量 部 分 的 物体 重量 (为 了 模拟 平衡 超出 部 分 ， 我 们 从 变量 n 中 减 去 已 测试 过 的 
夸 码 重量 )。 变 量 power 的 值 按 照 2 的 短 次 递减 。 若 power 的 值 超过 n，Binary 程序 打印 输 
出 0; 否则 ， 打印 1 并 从 mn 中 减 去 当前 power 的 值 。 和 往常 一 样 ， 我 们 展示 了 每 次 循环 迭代 
的 轨迹 (n 的 值 ，power 的 值 ，n<power 的 判断 结果 ， 每 次 迭代 输出 的 一 位 二 进 制 数 )， 以 帮 
助理 解 程序 的 执行 过 程 。 跟 踪 信 息 表 的 最 右边 从 上 到 下 看 ， 可 以 看 到 输出 结果 为 10011， 即 
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19 的 三 进 制 形式 。 


n 二 进 制 表示 power power>0 二 进 制 表示 n<power 输出 
19 10011 16 是 10000 否 1 

3 0011 8 是 1000 是 0 
3 011 4 是 100 是 0 
3 01 是 10 否 1 

1 1 1 是 1 否 1 
0 0 否 


运行 “java Binary 19”( 转 换 过 程 和 计算 过 程 的 跟踪 信息 ) 


编写 计算 机 程序 时 常见 的 一 类 任务 是 将 数据 从 一 种 表示 形式 转换 到 另 一 种 表示 形式 。 转 
换 思 想 强 调 的 是 信息 (例如 一 天 中 的 小 时 数 ) 和 信息 具体 表示 形式 (24 或 11000 ) 之 间 的 区 
别 。 值 得 一 提 的 是 ， 计 算 机 内 部 是 采用 二 进 制 数 的 形式 来 表示 int 变量 的 。 

模拟 。 下 一 个 例子 与 我 们 前 面 一 直 在 探讨 的 例子 在 性 质 上 有 所 不 同 ,但 它 代表 了 一 种 常 
见 的 情形 。 我 们 常常 使 用 计算 机 模拟 现实 世界 中 可 能 发 生 的 情况 ， 以 便 做 出 正确 的 选择 。 我 
们 现在 要 探讨 的 这 个 例子 来 自 于 著名 的 赌 徒 破产 原则 。 这 类 问题 已 经 得 到 较为 深入 的 研究 ， 
结论 是 ,一 开始 给 赌 徒 一 定 的 财产 ,假设 参与 的 是 一 个 公平 的 赌局 ， 每 次 下 注 1 美元 ， 赌 徒 
最 终 总 会 破产 。 但 是 ， 当 我 们 在 游戏 中 设置 一 些 限制 ， 各 种 问题 随 之 产生 。 例 如 ,假设 赌 徒 
在 达成 某 一 目的 之 后 决定 提前 离开 ， 赌 徒 有 没有 机 会 赢 ?3 要 最 终 赢 得 胜利 ， 需 要 多 少 赌资 ? 
赌 徒 在 过 程 中 可 获得 的 最 高 金额 是 多 少 ? 

程序 Gambler (程序 1.3.8 ) 是 一 个 模拟 程序 ， 可 以 帮助 回答 以 上 这 些 问题 。 在 程序 中 ， 
我 们 做 了 一 系列 的 尝试 ， 每 次 用 Math.random() 来 模拟 赌 徒 下 的 赌注 ， 一 直 持 续 到 赌 徒 破产 
或 达成 目标 ， 跟 踪 记 录 赌 徒 到 达 目 标 所 需 的 赌博 次 数 和 投注 次 数 。 我 们 将 实验 程序 运行 若干 
次 ,将 得 到 的 结果 取 平 均值 并 打印 出 来 。 你 可 能 希望 运行 这 个 程序 并 通过 命令 行 参 数 来 设置 
一 些 必要 的 值 ， 这 不 一 定 是 用 于 规划 你 下 一 次 的 赌场 之 旅 ， 而 是 为 了 帮助 你 思考 下 面 的 问 
题 : 模拟 是 否 能 够 准确 地 反映 现实 生活 中 会 发 生 什么 ?需要 进行 多 少 次 试验 才能 得 到 准确 的 
答案 ?进行 这 种 模拟 的 计算 限制 是 什么 ?模拟 广泛 应 用 于 经 济 、 科 学 和 工程 中 ， 以 及 回答 在 
任何 模拟 中 都 重要 的 类 似 问 题 。 

在 Gambler 这 个 例子 当中 ， 我 们 验证 了 概率 论 获胜 


的 经 典 结果 : 赌 徒 成 功 的 概率 是 赌注 与 目标 的 比率 ， 上 日本 
预期 的 投注 次 数 是 赌注 和 期 望 收 益 的 乘积 (收益 是 ， 巾 注 
指 目标 和 赌注 之 间 的 差 )。 例 如 ， 如 果 你 去 蒙特 卡 洛 


尝试 把 500 美元 变 成 2500 美元 ， 那 么 你 有 一 个 合理 。， 

的 (20%) 成 功 概率 ,但 你 需要 在 每 次 赌 1 美元 的 赌 

局 上 赌 100 万 次 。 如 果 你 尝试 将 1 美元 变 成 1000 美 是 和 

元 ， 则 只 有 0.1% 的 成 功 概率 ， 并 且 需 要 赌 大 约 999 赌注 

次 (最 有 可 能 的 还 是 破产 )。 站 TU 上 
模拟 和 分 析 是 相辅相成 的 ， 一 方 验证 另 一 方 。 实 “ 

际 上 ， 模 拟 的 意义 在 于 它 可 以 求解 一 些 难以 用 分 析 周 徙 程序 的 模拟 序列 
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解决 的 问题 ， 例 如 ， 假 设 赌 徒 可 能 意识 到 没有 足够 多 的 时 间 进 行 100 万 次 投注 ， 因 此 可 以 
提前 设 定投 注 次 数 的 上 限 。 在 这 个 例子 中 ， 赌 徒 能 赚 取 多 少 钱 回 家 ? 你 可 以 通过 对 程序 
1.3.8( 见 练习 1.3.26 ) 进行 简单 修改 来 解决 这 个 问题 ， 但 是 通过 数学 分 析 来 解决 这 个 问题 并 
不 容易 。 











程序 1.3.8” 赌 徒 破产 模拟 
















public class Gambler 
. 
public static void main(String[] args) 


| stake 初始 赌资 
| goal re 

























-hI Yh 
{ // 开始 运行 实验 时 资产 为 stake eh | We 
// 财 博 活动 终于 资产 为 0 或 者 资产 为 goal | bets | 下 注 数 
int stake = Integer.parseInt(args[0]); wins 获胜 次 数 
int goal = Integer.parseInt(args[1]); ] cash | 手 上 的 现金 


int trials = Integer.parseInt(args[2]); 
int bets = 0; 
int wins = 0; 
for Cint t = 0; t < trials; t++) 
{J/ 运行 实验 
int cash = stake; 
while (cash > 0 && cash < goal) 


{ // 模拟 一 次 赌博 
bets++; 
if (Math.random() < 0.5) cash++; 
else cash--; 


} J/ 现金 是 0 (破产 ) 或 者 是 goal (获胜 ) 


if (cash == goal) wins++; 





System.out.println(100*winsVtrials + "% wins"); 

System.out.println("Avg # bets: ”+ bets/trials); 
} 

} 


本 程序 需要 三 个 命令 行 参数 ， 即 三 个 int 类 型 变量 ，stake 、goal 和 trials， 
分 别 表示 赌注 、 目 标 和 试验 次 数 。 程 序 中 的 内 层 循环 模拟 一 个 拥有 赌资 stake 
的 赌 徒 做 了 一 系列 1 美元 的 赌注 ， 持 续 到 破产 或 者 达到 资产 为 goal。 该 程序 
的 运行 时 间 | 与 平均 下 注 试验 次 数 trials 成 正比 。 例 如 ;下 面 的 第 三 个 命令 会 
产生 将 近 1 亿 次 的 随机 实验 。 





% java Gambler 10 20 1000 
50% wins 

Avg # bets: 100 

% java Gambler™10 20 1000 
S1% wins 

Avg # bets: 98 


% java Gambler 50 250 100 
19% wins 

Avg # bets: 11050 

% java Gambler 500 2500 100 
21% wins 

Avg # bets: 998071 














整数 分 解 。 素 数 是 指 大 于 1 并 且 只 能 被 1 和 它 本 身 整除 的 整数 。 整 数 分 解 (也 称 为 素 
因子 分 解 ) 是 指 将 整数 分 解 为 若干 个 素数 ， 这 些 素数 的 乘积 是 整数 本 身 。 例 如 ，3 757 208= 
2X2X2X7X13X13X397。 程序 Factors (程序 1.3.9 ) 可 以 用 于 计算 任何 给 定 正 整数 的 素 因 
子 分 解 。 与 我 们 已 经 见 过 的 程序 相 比 ， 对 于 以 前 的 程序 我 们 是 可 以 用 计算 器 甚至 用 纸 和 笔 在 
几 分 钟 内 计算 出 来 的 ， 而 这 个 程序 的 计算 任务 如 果 没 有 计算 机 是 不 可 能 完成 的 。 如 何尝 试 找 
到 类 似 287994837222311 这 样 数 字 的 素数 因子 呢 ? 你 可 能 能 够 马上 发 现 因子 17， 但 是 即便 
使 用 了 计算 器 你 也 要 花费 一 段 时 间 才 能 找到 1739347。 
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dy 


44 锚 1 茧 


程序 13.9” 整数 分 解 





public class Factors 
n “| 未 被 分 解 的 部 分 | 
public static void main(String[] args) | factor 可 能 的 分 解 因子 上 
{ // 打印 n 的 素数 分 解 
long n = Long.parseLong(args[0]); 
for (long factor = 2; factor <= n/factor; factor++) 
{ // 测试 factor 是 不 是 因子 
while (n % factor == 0) 
{ // 从 n 中 除 掉 factor， 并 把 factor 打 印 出 来 
n /= factor; 
System.out.print(factor + " "); 


} 7V 任何 Hi 的 因子 都 必须 大 于 factor 


} 
if (n > 1) System.out.print(n); 
System.out.println(0) ; 








该 程序 要 求 从 命令 行 输 入 正 整 数 n 作 为 参数 ， 并 打印 的 素 因子 分 解 结果 。 
代码 非常 简单 ， 但 是 要 理解 它 的 原理 需要 花 一 些 工 夫 ( 见 正文 )。 


% java Factors 3757208 % java Factors 287994837222311 
2.2 2 13 3 397 17 1739347 9739789 


虽然 Factors 程序 很 短 ， 但 你 肯定 会 需要 一 些 思考 来 说 服 自 己 : 它 能 够 对 任何 给 定 的 整 
数 产生 所 需 的 结果 。 和 往常 一 样 ， 我 们 采用 跟踪 的 手段 ， 对 于 外 层 的 for 循环 ， 打 印 出 每 一 
次 迭代 开始 的 值 。 这 对 于 我 们 理解 计算 过 程 是 一 个 很 好 的 方案 。 对 于 初始 值 n 是 3757208 的 
情况 ， 当 factor 为 2 时 ， 内 部 的 while 循环 会 迭代 3 次 ， 即 要 从 n 中 分 解 出 3 个 值 为 2 的 因 
子 ， 此 时 n 的 值 变 成 469651; 当 factor 是 3、4、5 和 6 时 则 迭代 0 次 ,因为 这 些 数字 无 法 整 
除 n， 以 此 类 推 。 给 程序 输入 几 个 不 同 的 值 ， 跟 踪 执 行 的 过 程 可 以 发 现 程序 求解 的 基本 过 程 。 
为 了 确保 程序 对 于 所 有 的 输入 都 能 按照 预期 执行 ,我 们 会 解释 期 望 的 每 个 循环 做 的 是 什么 。 
while 循环 会 将 n 中 所 有 值 为 factor 的 因子 都 打印 出 来 并 将 其 从 待 分 解数 中 移 除 。 这 个 程序 
的 关键 在 于 ， 每 次 for 循环 开始 迭代 前 , n 当中 肯定 没有 大 于 2 并 且 小 于 factor-1 的 因子 。 
因此 ， 如 果 factor 不 是 素数 ， 它 将 不 能 整除 n; 如 果 factor 是 一 个 素数 ， 那 么 ,while 循环 将 会 
测试 是 否 可 以 整除 并 将 factor 移 除 。 一 旦 我 们 知道 n 没有 小 于 或 等 于 factor 的 因子 ， 我 们 也 
知道 没有 因子 大 于 n /factor， 所 以 当 factor 大 于 n /factor 时 ， 我 们 也 就 不 需要 再 继续 循环 了 。 





3757208 a 了 67093 

469651 13 67093 13 13 
4 469651 14 397 

$ 469651 15 397 

6 469651 16 397 

7 469651 17 397 

8 67093 18 397 

67093 19 397 

10 67093 20 397 

11 67093 397 


跟踪 3757208 的 整数 分 解 


一 个 更 简单 而 直接 的 实现 方式 是 , 我 们 可 以 使 用 语句 ( factor<n) 来 作为 终止 for 循环 的 
条 件 。 即 使 考虑 到 现代 计算 机 的 计算 速度 ， 这 样 做 也 会 对 我 们 可 以 计算 的 数字 的 大 小 产生 巨 
大 的 影响 。 在 练习 1.3.28 中 我 们 希望 使 用 这 种 简单 的 实现 方式 ， 从 而 体会 这 个 小 小 的 修改 
给 程序 性 能 带 来 的 变化 。 如 果 按 照 这 样 简单 的 实现 方式 ， 在 每 秒 可 以 执行 数 十 亿 次 的 计算 机 
上 ,我 们 可 以 在 几 秒 钟 内 计算 出 10 数量 级 的 数字 的 素 因子 分 解 ; 而 如 果 使 用 ( factor<= n/ 
factor) 作为 测试 条 件 ， 我 们 可 以 在 这 个 运行 时 间 内 完成 对 108 数量 级 的 数字 的 素 因子 分 解 。 
循环 使 我 们 有 能 力 解决 艰难 的 问题 ， 但 也 会 使 我 们 的 简单 程序 运行 得 非常 慢 ， 所 以 我 们 在 编 
程 的 过 程 中 必须 时 刻 注意 计算 方法 对 性 能 的 影响 。 

在 现代 密码 学 的 应 用 中 , 在 一 些 重 要 的 情况 下 我 们 需要 对 非常 巨大 的 数字 ( 数 百 或 数 千 
位 数字 ) 做 素 因 子 分 解 ， 而 这 时 即使 使 用 计算 机 ， 完 成 这 样 的 计算 任务 也 是 非常 困难 的 。 

其 他 形式 的 条 件 和 循环 结构 ”为 了 更 全 面 地 介绍 Java 语言 ， 我 们 在 这 里 再 介绍 四 种 控 
制 结构 ， 你 不 必 考 虑 将 这 些 结构 用 于 你 自己 编写 的 每 个 程序 ， 因 为 你 遇 到 它们 的 频率 远 远 
低 于 证、while 和 for 语句 。 在 熟练 使 用 证 、while 和 for 语句 前 不 用 担心 如 何 使 用 这 些 结构 。 
你 可 能 会 在 书籍 或 者 网 络 中 看 到 它们 ， 但 是 许多 程序 员 并 不 使 用 它们 ， 且 本 书 在 这 一 节 之 外 
也 很 少 使 用 它们 。 

break 语句 。 在 某 些 情况 下 ,我 们 想 立 即 退 出 循环 ， 而 不 是 让 其 运行 直到 循环 结束 。 
Java 为 此 提供 了 break 语句 。 例 如 ， 以 下 代码 能 够 检测 给 定 整 数 n>1 是 否 为 素数 : 


int factor; 

for (factor = 2; factor <= n/factor; factor++) 
if (n % factor == 0) break; 

if (factor > n/factor) 
System.out.printin(n + ”is prime"); 


退出 这 个 循环 有 两 种 不 同 的 方法 : break 语句 被 执行 (因为 n 能 够 被 factor 整除 ， 因 此 n 
并 不 是 一 个 素数 ) 或 者 循环 条 件 不 满足 (因为 对 于 满足 factor<=n/factor 的 每 种 情况 ，n 都 无 
法 整除 factor， 则 nm 是 素数 )。 注 意 ,我们 在 for 循环 的 外 部 声明 factor， 而 不 是 在 for 循环 
的 初始 语 名 中， 这样 factor 的 作用 域 就 能 拓展 到 循环 以 外 了 。 

continue 语句 。Java 还 提供 了 一 种 跳 转 到 下 一 个 循环 迭代 的 方法 : continue 语句 。 当 
在 for 循环 的 主体 内 执行 continue 语句 时 ， 控 制 流 将 直接 传递 给 递增 语句 以 用 于 下 一 次 循环 
迭代 。 

Switch 语句 。 计 和 if-else 语句 允许 在 控制 流 中 产生 一 个 或 者 两 个 可 供 选 择 的 方向 。 有 时 
候 ， 一 个 计算 会 产生 两 种 以 上 互 斥 的 选择 。 我 们 可 以 使 用 一 系列 if-else 语句 (如 本 节 前 面 讨 
论 的 税率 计算 问题 )， 但 是 Java 的 switch 语句 提供 了 一 个 更 加 直接 的 解决 方案 。 让 我 们 列举 
一 个 典型 的 例子 。 如 果 我 们 想 把 用 来 表示 星期 几 的 一 个 int 型 变量 用 更 加 友好 的 方式 显示 出 
来 (如 练习 1.2.29 的 解决 方案 )， 用 switch 语句 更 加 容易 ， 如 下 所 示 : 


switch (day) 
{ 


case 0: System.out.printin("Sun"); break; 
case 1: System.out.println("Mon"); break; 
case 2: System.out.printin("Tue"); break; 
case 3: System.out.printin("Wed"); break; 
case 4: System.out.printin("Thu"); break; 
case 5: System.out.printin("Fri"); break; 
case 6: System.out.printin("Sat"); break; 
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当 你 有 一 个 看 起 来 很 长 并 且 很 有 规则 的 站 语句 时 ， 你 可 以 尝试 使 用 switch 语句 ， 或 者 
1.4 节 中 描述 的 替代 方法 。 
do-while 循环 。 男 一 个 写 循环 的 方法 是 使 用 下 面 的 模板 : 


do { < 语句 > } while (< 布尔 表达 式 >); 
这 个 语句 的 意思 和 以 下 语句 基本 一 样 : 
while (< 布尔 表达 式 >) { < 语句 > } 


只 是 布尔 条 件 的 第 一 个 测试 会 被 省 略 。 如 果 布 尔 条 件 最 初 是 成 立 的 ， 那 么 二 者 没有 区 别 。 为 
了 展示 do-while 的 用 途 ， 考 虑 这 样 一 个 例子 ， 如 果 要 在 单位 圆 中 生成 随机 分 布 的 点 ， 我 们 
可 以 使 用 Math.random() 独立 地 生成 x 和 yy 坐标， 以 获得 随机 分 布 在 以 原点 为 中 心 的 2X2 
正方 形 中 的 点 。 大 多 数 点 同时 也 会 落 在 圆 内 ， 所 以 我 们 只 是 拒绝 那些 没有 落 在 圆 内 的 。 我 们 
总 是 希望 至 少 生 成 一 个 点 ， 所 以 do-while 循环 对 于 这 个 计算 来 说 是 比较 理想 的 。 下 面 的 代 
码 设 置 x* 和 yy， 使 得 点 (x，y) 随机 分 布 在 单位 圆 中 : 011) 
~ 


{ // 将 x 和 y 缩 放 为 (-1, 1) 中 的 随机 变量 
x = 2.0*Math.random() - 1.0; 
y = 2.0*Math.random() - 1.0; 

} while (x*x + y*y > 1.0); 

由 于 圆 的 面积 是 r ， 和 矩形 的 面积 是 4， 因 此 循环 预期 的 
迭代 次 数 为 4/ 立 (大 约 是 1.27 )。 

无 限 循环 〈 又 称 死 循环 ) 在 使 用 循环 编写 程序 前 ， 你 需 
要 思考 一 下 这 个 问题 : 如 果 一 个 while 循环 中 的 循环 条 件 总 
是 成 立 的 ， 会 发 生 什么 情况 ?” 对 于 你 迄今 为 止 学 习 到 的 语句 ， 都 有 可 能 出 现 类 似 这 样 的 意 
想不到 的 情况 ， 但 是 无 论 发 生 哪 种 情况 你 都 要 学 会 去 处 理 。 

第 一 种 情况 : 我 们 假设 这 样 的 一 个 无 限 循环 调用 了 System.out.println() 函数 。 例 如 ， 
如 果 TenHellos 程序 中 循环 继续 的 条 件 为 (i>3 ) 而 不 是 (i<=10 )， 那 么 这 个 条 件 将 会 总 为 
真 ， 接 下 来 会 发 生 什 么 呢 ?” 在 当前 的 开发 环境 中 ,我 们 调用 print 时 ， 它 的 作用 是 在 显示 
器 的 终端 窗口 中 显示 相应 的 内 容 。 在 终端 窗口 中 尝试 显示 无 限 多 的 行 ， 具体 会 产生 什么 
样 的 结果 是 由 操作 系统 的 设计 者 决定 的 。 但 如 果 print 的 作用 是 在 纸 上 打 印字 符 ， 那 么 就 
有 可 能 用 完 所 有 的 打印 纸 或 者 需要 拔 掉 打 印 机 电源 才能 使 它 停 下 来 。 在 终端 窗口 中 ,我 们 
也 需要 一 个 停止 打印 的 操作 。 在 运行 自己 的 循环 程序 前 ， 你 需要 知道 如 何在 System.onut. 
println() 调用 的 无 限 循环 中 “ 拔 掉 开 关 ”， 然 后 再 修改 上 述 TenHellos 程序 并 测试 它 的 运 
行 结果 。 在 大 多 数 程序 中 ,<Ctrl-C> 的 意思 是 停止 当前 程序 ， 在 这 里 可 以 用 来 停止 循环 
打印 。 

第 二 种 情况 : 无 限 循环 的 程序 运行 之 后 可 能 什么 都 没 发 生 。 如 果 你 的 程序 中 有 一 个 无 限 
循环 并 且 没 有 产生 任何 输出 ， 那 么 程序 会 被 锁 在 这 个 循环 当中 而 你 也 看 不 到 任何 结果 。 当 处 
于 这 种 情况 时 ， 你 可 能 要 检查 循环 以 确保 它 一 定 会 触发 退出 条 件 ， 但 是 问题 常常 是 无 法 确定 
哪个 循环 在 什么 情况 下 出 了 问题 。 在 查找 问题 的 过 程 中 ,你 可 以 通过 插入 System.onut. 
println() 调用 函数 去 跟踪 循环 的 执行 。 如 果 加 入 的 这 些 函 数 正好 处 于 一 个 无 限 循环 中 ， 那 么 


x 








编程 雹 于 47 


我 们 就 回 到 了 上 一 段 中 讨论 的 问题 ， 你 可 以 想 办 法 停止 窗口 中 的 打印 信息 ， 并 且 这 些 输出 信 
息 会 告诉 你 无 限 循环 发 生 在 什么 地 方 。 public class BadHellos 
你 可 能 无 法 确定 (或 者 可 能 也 并 不 在 意 ) 一 个 循环 是 无 限 的 还 是 只 ;; . ， 


是 很 长 。 由 于 int 数 溢出 的 原因 ， 即 使 是 BadHellos 程序 最 终 也 会 在 打 Ye (i > 3) 
印 超过 十 亿 行 以 后 终止 。 如 果 你 调用 程序 1.3238 时 使 用 如 下 参数 : java System.out,.println 


Gambler 100000 20000 100， 你 可 能 永远 也 无 法 等 到 答案 。 后 面 你 将 会 ，G fa 110; 


i=i+l1; 
学 到 估算 程序 运行 时 间 的 方法 。 1 
为 什么 Java 没有 直接 检测 无 限 循环 并 警告 我 们 呢 ? 答案 可 能 会 让 
你 很 惊讶 。 一 般 来 说 ， 我 们 是 无 法 检测 到 无 限 循环 的 。 虽 然 这 个 结论 有 * java Bacne os 


1st Hello 


违 常 理 ， 但 却 是 理论 计算 机 科学 的 基本 结果 之 一 。 2nd Hello 
总 结 “作为 参考 ， 附 表 列 出 了 我 们 在 本 节 中 探讨 过 的 程序 。 它 们 Sh hele 
是 我 们 可 以 用 让 、while 和 for 语句 及 内 置 数据 类 型 来 编写 短程 序 以 解 5th en 


决 的 典型 任务 。 完 成 这 些 计 算 的 编程 ， 也 是 熟悉 基本 的 Java 控制 流程 …… 
结构 语句 的 一 种 有 效 方法 。 一 个 无 限 循环 的 例子 


程序 描述 
Flip 模拟 硬币 的 投掷 
TenHellos 第 一 个 循环 语句 
PowersOfTwo 计算 并 打印 一 个 函数 的 取 值 表 
DivisorPattern 你 的 第 一 个 嵌 套 循环 
Harmonic 计算 有 限 个 数字 的 和 
Sqrt 经 典 的 迭代 算法 
Binary 基本 的 数 制 转换 
Gambler 利用 嵌 套 循环 进行 模拟 
Factors for 循环 柑 套 while 循环 
本 节 中 程序 的 总 结 


为 了 学 习 如 何 使 用 条 件 语句 和 循环 语句 ， 你 需要 练习 编写 并 调试 让、while 和 for 语句 。 
本 节 结 尾 的 练习 为 你 提供 了 这 样 的 机 会 。 对 于 每 个 练习 ， 你 需要 编写 一 个 Java 程序 ， 运 行 
并 测试 它 。 所 有 的 程序 员 都 知道 ， 第 一 个 程序 运行 很 难 按照 计划 来 执行 ， 所 以 你 需要 了 人 解 你 
的 程序 ， 并 明白 它 的 每 一 步 应 该 做 什么 。 首先 ， 使 用 跟踪 的 方法 来 检查 你 的 理解 是 否 正确 。 
当 你 逐渐 熟悉 之 后 ， 你 就 可 以 在 编写 循环 程序 的 同时 想象 跟踪 语句 的 输出 结果 。 在 编程 的 过 
程 中 ， 你 需要 问 自己 以 下 几 个 问题 : 在 第 一 次 循环 迭代 后 ， 变 量 的 值 是 什么 ? 第 二 次 呢 ? 最 
后 一 次 呢 ? 在 什么 情况 下 这 个 程序 会 陷入 无 限 循环 ? 

循环 和 条 件 语句 提升 了 我 们 的 计算 能 力 : ff、while、for 语句 使 我 们 从 仅 能 编写 简单 
的 直线 程序 转换 为 可 以 编写 任意 复杂 的 控制 流程 程序 。 在 接 下 来 的 章节 中 ,我 们 还 会 有 巨 
大 的 收获 ,我 们 将 学 习 如 何 处 理 大 数据 量 的 输入 ， 并 学 习 如 何 定义 和 处 理 除 简单 数值 类 型 
以 外 的 数据 类 型 。 本 节 中 的 if、while 和 for 语句 在 我 们 接 下 来 的 程序 中 将 扮演 至 关 重 要 的 
角色 。 


48 党 工 章 


问答 环节 

问 : = 和 二 之 间 的 区 别 是 什么 ? 

答 : 我 们 在 这 里 重复 这 个 问题 是 为 了 提醒 你 ， 当 你 想 对 两 个 数字 是 否 相等 进行 布尔 判 
断 时 不 要 使 用 “=”， 而 一 定 要 使 用 “ ==”。 表 达 式 (x=y) 是 将 y 的 值 赋值 给 x， 而 表达 式 
(x==y) 是 测试 两 个 变量 是 否 有 相同 的 值 。 在 一 些 编程 语言 中 ， 这 种 差异 可 能 会 对 程序 造成 
严重 的 破坏 ， 并 且 难 以 发 现 ， 但 是 Java 的 类 型 安全 通常 能 及 时 发 现 这 种 问题 。 例 如 ， 如 果 我 
们 在 程序 1.3.8 中 输入 (cash=goal) 而 不 是 (cash==goal)， 编 译 器 将 自动 为 我 们 发 现 这 个 问题 : 


javac Gambler .java 
Gambler.java:18: incompatible types 
found : int 
required: boolean 
if (cash = goal) wins++; 
A 


1 error 


cash 和 goal 都 不 是 布尔 类 型 ， 因 此 编译 器 可 以 发 现 这 个 错误 。 但 是 ， 当 x 和 y 都 是 布 
尔 值 变量 时 就 需要 格外 小 心 ， 如 果 你 写成 了 if (x=y)， 这 将 被 视 为 一 个 赋值 语句 ， 它 的 作用 
是 将 y 的 值 分 配给 x， 它 的 计算 结果 就 是 y 的 值 。 为 了 避免 这 类 错误 ， 你 应 该 把 代码 写成 
if(lisPrime)， 而 不 是 if(isPrime = false)。 

问 : 所 以 需要 在 写 循环 和 条 件 语 句 时 小 心 注意 ， 应 该 使 用 “ ==” 而 不 是 “=”。 还 有 什 
么 值得 我 特别 注意 的 吗 ? 

答 : 另 一 个 常见 的 错误 是 在 多 个 组 合 的 条 件 语 句 块 或 者 循环 语句 块 中 忘记 大 括号 ， 例 
如 ， 下 面 这 段 代码 是 Gambler 程序 的 另 一 种 实现 方式 : 


for Cint 七 = OFTt'< trials; t++) 
for (cash = stake; cash > 0 && cash < goal; bets++) 
if (Math.random() < 0.5) cash++; 
else cash--; 
if (cash == goal) wins++; 


代码 看 起 来 正确 ， 但 实际 上 并 不 正确 。 因 为 第 二 个 让 在 for 循环 之 外 ， 所 以 只 会 执行 一 
次 。 基 于 许多 程序 员 的 编程 习惯 ,无论 循 环 体 或 者 条 件 语句 包含 几 条 语句 ， 都 要 使 用 大 括号 
将 它们 包括 起 来 ， 以 界定 一 个 循环 和 条 件 的 边界 。 这 是 一 个 很 好 的 编程 习惯 ， 能 够 有 效 避 免 

这 类 错误 。 

问 : 还 有 其 他 的 吗 ? 

答 : 第 三 个 经 典 陷 阱 是 租 套 使 用 认 语 句 时 会 产生 的 歧义 : 

if < 表达 式 ]> if < 表达 式 2> < 语句 入 > else < 语句 B> 

在 Java 中 这 等 同 于 : 

if < 表达 式 1> { if < 表达 式 2 > < 语句 A> else < 语句 B> } 

你 可 能 会 觉得 它 应 该 按照 下 面 的 模式 执行 : 

if < 表达 式 1> { if < 表达 式 2 > < 语句 A> } else < 语句 B> 

再 次 提醒 ， 明 确 使 用 括号 来 划 定 语句 体 是 避免 这 种 错误 的 有 效 方法 。 

问 : 是 否 存在 某 些 情况 必须 使 用 for 循环 而 不 能 使 用 while 循环 ? 或 者 反 过 来 。 
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答 : 没有 ， 一般 来 说 ， 当 你 的 任务 可 以 划分 成 初始 化 变量 、 变 量 增 量 和 循环 条 件 测试 三 
部 分 ， 并 且 你 不 需要 在 循环 外 再 使 用 循环 控制 变量 时 ， 应 该 使 用 for 循环 。 但 是 也 可 以 使 用 
while 循环 实现 完全 等 价 的 功能 。 

问 : 循环 控制 变量 声明 的 位 置 有 什么 规则 吗 ? 

答 : 对 于 这 个 问题 大 家 有 不 同 的 见解 。 在 一 些 早期 的 编程 语言 中 ， 要 求 所 有 变量 声明 
放 在 语句 块 开 始 之 前 ， 很 多 程序 员 都 习惯 了 这 种 方式 ， 并 且 很 多 代码 也 是 遵循 这 个 约定 书 
写 的 。 但是， 在 第 一 次 使 用 变量 时 再 声明 它 也 是 非常 合理 的 一 种 方法 ， 特 别 是 对 于 for 循 
环 ， 在 一 般 情况 下 ,循环 变量 在 for 循环 之 外 也 很 少 被 用 到 。 从 男 一 方面 说 ， 在 循环 外 部 需 
要 用 到 循环 控制 变量 的 情况 也 并 不 少见 ， 如 我 们 在 讲解 break 时 的 示例 代码 中 做 素数 检测 那 
部 分 。 

问 : i++ 和 ++i 之 间 的 区 别 ? 

答 : 作为 一 个 独立 的 语句 ， 这 两 者 没有 任何 的 区 别 。 但 如 果 作 为 一 个 部 分 出 现在 表达 
式 中 ， 两 者 还 是 有 差异 的 。 它 们 都 可 以 使 得 i 值 加 1, 但 是 ++i 返 回 的 是 增加 以 后 的 值 ， 而 
it+ 返回 增加 之 前 的 值 。 在 本 书 中 ,我 们 尽量 避免 使 用 类 似 x=++i 这 样 的 代码 ， 因 为 它 除 了 
赋值 还 会 改变 原来 变量 的 值 ， 这 是 不 安全 的 。 我 们 并 不 想 花 费 过 多 的 精力 分 析 两 者 在 for 循 
环 中 的 区 别 ， 因 此 我 们 在 for 循环 中 统一 使 用 i++， 在 独立 的 语句 中 也 用 i++。 只 有 在 特殊 情 
况 下 我 们 才 会 使 用 ++i， 那 时 我 们 会 专门 提醒 注意 并 解释 为 什么 要 使 用 它 。 

问 : 在 一 个 for 循环 中 ，< 初始 化 语句 > 和 < 增 量 语句 > 可 以 做 很 多 复杂 的 事情 ， 远 不 
止 声明 变量 、 初 始 化 和 更 新 循环 增 量 语句 。 我 们 该 如 何 利 用 这 个 功能 ? 

答 : < 初始 化 语句 > 和 < 增 量 语句 > 可 以 是 通过 逗号 分 隔 的 一 系列 语句 。 这 种 表示 法 使 
得 我 们 除了 可 以 初始 化 或 者 修改 循环 控制 变量 以 外 ， 还 可 以 操作 其 他 变量 。 在 有 些 情 形 中 ， 
这 种 写法 可 以 导致 代码 十 分 紧凑 。 例 如 ， 以 下 两 行 代码 可 以 替代 PowersOfTwo 程序 (程序 
1.3.3 ) 中 main() 语句 块 的 最 后 8 行 。 


for (int i = 0, power = 1; i <= ni i++, power *= 2) 
System.out.println(i + " " + power); 


这 样 压 缩 代码 其 实 并 没有 什么 必要 ， 所 以 尽 可 能 不 要 这 么 写 ， 尤 其 是 对 于 初学 者 而 言 。 
问 : 在 for 循环 中 可 以 使 用 double 类 型 的 变量 作为 循环 控制 变量 吗 ? 
答 : 这 是 可 以 的 ,但 通常 不 要 这 样 做 。 考 虑 以 下 循环 : 


for (double x = 0.0; x <= 1.0; x += 0.1) 
System.out.printin(x + " " + Math.sin(x)); 


这 个 循环 会 迭代 多 少 次 ?迭代 的 次 数 取 决 于 测试 两 个 double 类 型 的 值 是 否 相等 ， 由 于 
浮 点 数 的 精度 问题 可 能 永远 不 能 获得 你 预期 的 结果 。 
问 : 在 循环 中 还 有 什么 环 手 的 问题 吗 ? 
答 : for 循 环 语句 中 的 各 个 组 成 块 都 是 可 it power = 12) 
以 省 略 的 ， 初 始 化 语句 、 布 尔 表达 式 、 增 量 语 power “= 2; 增 大 语 锯 为 空 
句 和 循环 体 每 一 个 部 分 都 可 以 是 空 语句 ( 即 不 dd 
存在 )。 但 是 ,为 了 便于 理解 和 阅读 ， 最 好 使 用 


for (int power = 1; power <= n/2; power *= 2) 


while 循环 来 代 蔡 有 空 语句 的 for 循环 。 在 本 书 ;一 循环 体 为 空 
的 代码 中 ,我 们 将 避免 出 现 这 样 带 有 空 语句 的 三 个 等 价 的 循环 
for 循环 。 


1.3.8 


1.3.9 
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L313 


1.3.14 


编写 一 个 程序 ， 需 要 输入 三 个 整 型 命令 行 参数 ， 如 果 三 个 数 相等 则 在 终端 窗口 中 打印 “ equal”， 
否则 打印 “not equal”。 

编写 一 个 更 通用 、 更 健壮 的 Quadratic 程序 (程序 1.2.3 )， 用 于 求解 并 打印 多 项 式 ax?+bx+tc 的 
根 。 如 果 判 别 式 是 负数 则 打印 合适 的 提示 信息 ; 如 果 a 是 0， 则 给 出 合理 的 提示 信息 (避免 除 


数 为 零 的 情况 ) 

以 下 每 个 语句 有 什么 问题 (如果 有 的 话 ) ? 

a. if (a>b) then c=0; b. if a>b { c=0; } 

c. if (a>b) c=0; d. if (a>b) c=0 else b=0; 


编写 一 个 代码 段 ， 如 果 双 精度 变量 x 和 y 的 值 都 严格 在 0 和 1 之 间 则 打印 ， 否 则 为 假 。 
编写 一 个 RollLoadedDie 程序 ， 打 印 一 个 不 公平 的 掷 仍 子 游戏 的 结果 ， 使 得 获得 1、2、3、4 或 
者 5 的 概率 是 1/8， 获 得 6 的 概率 是 3/8。 
通过 添加 代码 改进 练习 1.2.25 来 提高 你 的 解决 方案 ， 检 查 命令 行 参数 在 公式 中 是 否 有 效 ， 并 且 
添加 代码 来 打印 如 果 不 是 这 种 情况 下 的 错误 消息 。 
假设 i 和 j 都 是 int 类 型 。 执 行 以 下 每 个 语句 ，j 的 值 是 多 少 ? 
a. for (i=0, j=0; i<10; i++) j+=i; b. for (i=0, j=1; i<10; i++) j+=j; 
c. for (=0; j<10; j++) j+=); d. for (1=0, j=0; 1<10; 1++) J+=]++; 
重 写 TenHellos 来 创建 一 个 Hellos 程序 ， 该 程序 采用 命令 行 参数 来 设置 要 打印 的 行 数 ， 你 可 以 
假设 参数 小 于 1000。 提 示 : 使 用 i%10 和 i%100 来 确定 打印 第 i 个 Hello 应 该 使 用 st、nd、rd 
还 是 th。 
编写 一 个 程序 ， 使 用 一 个 for 循环 和 一 个 让 语句 ， 打 印 1000 到 2000 之 间 的 整数 ， 每 行 5 个 数 
字 。 提 示 : 使 用 % 操作 。 
编写 一 个 程序 ， 要 求 输入 int 型 命令 行 参数 n， 然 后 使 用 Math.random() 生成 并 打印 n 个 均匀 随 
机 值 ， 假 设 这 些 值 的 取 值 范围 处 于 0 和 1 之 间 ， 然 后 计算 并 打印 它们 的 平均 值 ( 见 练习 1.2.30 )。 
当 你 尝试 打印 标尺 函数 ( 见 “ 使 用 while 和 for 循环 的 典型 示例 ”表格 ) 时 ， 如 果 使 用 的 n 值 
过 大 (如 100 ) 会 发 生 什 么 ? 
编写 一 个 函数 FunctionGrowth 打印 logn、n、nlogn、nr、mw”、2” 的 取 值 表格 ， 其 中 的 取 值 是 
16、32、64、…、2048。 使 用 制 表 符 (\t 字符 ) 来 实现 对 齐 。 
执行 以 下 代码 后 ，m 和 n 的 值 是 多 少 ? 


int n = 123456789; 
int m= 0; 
while (n != 0) 
{ 
m 
n 


} 
运行 以 下 代码 ， 将 会 打印 出 什么 样 的 信息 ? 


int f= 0; 9g = 1; 
for (int 1 = 0; i <= 15; i++) 


(10 * m) + (Cn % 10); 
ns 


{ 
System.out.print1n(f); 
f=f+9g; 
gr= E98 


} 
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答案 : 即使 是 编程 专家 也 会 告诉 你 理解 这 样 一 个 程序 的 唯一 方法 是 对 程序 进行 跟踪 。 当 你 
这 样 做 时 ， 你 会 发 现 它 的 打印 值 为 0、1、1、2、3、5、8、13、21、34、55、89、144、233、 
377 和 610。 这 是 著名 的 斐 波 那 契 数 列 的 前 16 个 ， 它 的 公式 定义 如 下 ，Fo=0, Fi=1， 当 nn21 时 
E.=Fart Fn:zo 
以 下 代码 段 将 会 产生 多 少 行 输出 ? 


for (int i = 0; i < 999; i++); 
{ System.out.printin("Hello"); } 


答案 : 只 打印 一 行 。 注 意 第 一 行 末尾 的 分 号 。 
编写 一 个 程序 ， 采 用 int 型 命令 行 参数 n 并 打印 所 有 小 于 或 等 于 n 并 且 是 2 的 寡 的 正 整数 。 确 
保 你 的 程序 对 所 有 n 的 取 值 都 是 正确 的 。 
拓展 你 的 练习 1.2.24 程序 ， 让 它 打印 一 张 表格 ， 列 出 最 后 支付 的 总 金额 和 每 个 月 还 款 后 剩余 
的 本 金 。 
与 谐 波 数 不 同 ， 对 于 LE+12:+…+12 之 和 ， 当 nn 增长 到 无 穷 大 时 ， 它 会 收敛 到 一 个 常数 (这 
个 常数 是 匡 /6， 所 以 这 个 等 式 可 以 用 来 估算 wm 的 值 )。 以 下 哪个 for 循环 可 以 用 于 计算 这 个 总 
和 ? 假设 n 是 初始 值 为 1000000 的 int 型 变量 ，sum 是 初始 化 为 0.0 的 double 型 变量 。 
a. for (int i=1; i<=n; i++) sum+=1/(1*1i); b. for (int 1=1; i<=n; i++) sum+=1.0/i*i; 
c. for (int i=1; i<=n; i++) sum+=1.0/(1*7); d. for (int i=1; i<=n; i++) sum+=1/(1.0*1*1); 
程序 1.3.6 实现 了 基于 牛顿 法 找到 e 的 平方 根 ， 解 释 它 的 工作 原理 。 提 示 : 牛顿 法 可 以 用 来 解 
决 任何 函数 的 求 根 问题 对 于 可 导 函 数 fx)， 在 x=t 处 的 切线 斜率 为 /'(t)， 利 用 这 个 结果 就 可 
以 求 出 切线 方程 ， 然 后 使 用 该 方程 找到 切线 与 x 轴 相 交 的 地 方 ， 然 后 ， 在 每 次 迭代 时 ， 将 估算 
值 :替代 为 tfD)/f'(0)。 
开发 一 个 程序 ， 由 命令 行 输入 两 个 int 型 参数 n、k， 用 牛顿 法 求 出 n 的 k 次 方 根 (提示 : 请 参 
考 练习 1.3.19 )。 
以 程序 Binary 为 基础 编写 一 个 新 程序 Kary， 输 入 两 个 命令 行 参 数 1 和 k， 并 将 i 转换 为 基数 k 
的 数 制 表示 。 假 设 i 是 Java 中 的 long 数据 类 型 , k 是 2 到 16 之 间 的 整数 。 对 于 大 于 10 的 基 使 
用 A 到 下 来 表示 第 11 位 到 第 16 位 数字 。 
编写 一 段 代码 ， 将 整数 n 的 二 进 制 表 示 放 入 字符 串 变 量 s 中 。 

答案 : 对 于 这 一 问题 ，Java 中 有 一 个 内 置 函 数 Integer.toBinaryString(n), 但 是 练习 的 重点 
不 是 使 用 这 个 函数 ， 而 是 如 何 实现 这 个 函数 。 基 于 程序 1.3.7， 我 们 可 以 得 到 解决 方案 : 


String’*s = ”3 

int power = 1; 

while (power <= n/2) power *= 2; 
while (power > 0) 


if (Cn < power) { s += 0; } 
else {s+= 1; n -= power; } 
power /= 2; 

} 


另 一 个 简单 的 通过 从 右 到 左 逐 位 输出 的 方案 如 下 : 
SR 
for Cint 1 en 1 > 0; 1 /= 2) 


Ss= (ii%2) +S; 


这 两 种 方法 都 需要 仔细 研究 才能 明白 它 的 原理 。 
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为 Gambler 程序 编写 一 个 新 的 版 本 ， 使 用 两 个 嵌 套 的 for 循环 或 者 两 个 嵌 套 的 while 循环 来 实 
现 ， 以 代替 现在 for 循环 中 内 骨 while 循环 的 实现 方式 。 

编写 一 个 GamblerPlot 程序 ， 通 过 每 次 下 注 后 打印 一 行星 号 以 表示 赌 徒手 中 的 赌资 ， 一 颗 星 代 
表 赌 徒手 中 有 一 美元 ， 跟 踪 并 打印 赌 徒 破产 的 模拟 过 程 。 

修改 Gambler 程序 ， 增 加 一 个 命令 行 参数 p 用 于 指定 赌 徒 每 次 下 注 时 获胜 的 概率 (假设 整个 赌 
博 过 程 中 概率 固定 )。 使 用 你 的 程序 尝试 分 析 这 种 概率 是 如 何 影 响 获胜 的 机 会 和 预期 的 投注 次 
数 的。 实验 时 使 用 的 p 值 应 接近 0.5 (如 0.48 )。 

修改 Gambler 程序 ， 增 加 一 个 命令 行 参 数 用 于 指定 每 次 愿意 进行 的 投注 次 数 ， 在 游戏 结束 时 
有 三 种 可 能 性 : 赌 徒 获胜 、 破 产 或 者 时 间 耗 尽 。 在 游戏 结束 时 ， 输 出 赌 徒 拥有 的 金额 。 可 以 
试 试 使 用 你 的 程序 计划 你 的 下 一 次 蒙特 卡 洛 赌场 之 旅 。 

修改 Factors 程序 ， 对 于 相同 的 因子 只 打印 一 次 。 

对 于 Factors 程序 (程序 1.3.9 )， 快 速 地 运行 几 次 实验 以 确定 使 用 终止 条 件 的 影响 。 对 于 
( factor<= n /factor) 或 者 是 ( factor<n)， 找 到 最 大 的 n， 使 得 在 你 输入 一 个 n 位 数字 时 ， 程 序 
能 够 在 10s 内 结束 。 

编写 一 个 Checkerboard 程序 ， 输 入 一 个 int 型 命令 行 参数 nm， 使 用 一 个 艇 套 的 循环 ， 打 印 出 一 
个 nxXn 棋 盘 ,， 模 盘 上 的 空格 和 是 号 交替 出 现 。 

编写 一 个 GreatestCommonDivisor 程序 ， 它 使 用 Euclid 算 法 找到 两 个 整数 的 最 大 公约 数 
(gcd)， 它 是 基于 下 面 的 规律 进行 迭代 计算 的 : 假设 x 大 于 y， 如 果 y 可 以 整除 x， 那么 x 和 yy 
中 的 最 大 公约 数 是 了 7， 否则 x 和 yy 的 最 大 公约 数 与 x%y 和 yy 的 最 大 公约 数 相同 。 

编写 RelativelyPrime 程序 ， 输 入 一 个 int 型 命令 行 参 数 n， 打 印 一 个 nXn 的 表格 ， 如 果 i 和 j 
的 最 大 公约 数 是 1， 则 在 第 i 行 和 第 j 列 上 打印 一 个 “*” (我 们 称 1 和 j 是 互 素 的 )， 否 则 在 此 
位 置 上 打印 一 个 空格 。 

编写 一 个 程序 PowersOfK ， 输 入 int 型 命令 行 参数 k， 并 打印 Java 的 long 数据 类 型 中 所 有 kk 
的 震 。 注 意 : 常量 Long.MAX VALUE 是 长 整 型 数据 中 最 大 的 数值 。 

编写 一 个 打印 球体 表面 随机 点 (a,b,c) 坐标 的 程序 。 为 了 产生 这 样 的 一 个 点 ， 请 使 用 Marsaglia 
方法 : 首先 根据 本 节 末 尾 的 描述 在 单位 圆 上 选择 一 个 随机 点 (x*，?7)。 然 后， 设置 o 为 


2x41-z2-yy,， 5 为 2 和 -=x 这， 记 为 122 (24 有 六 


创新 练习 


1.3.34 


1.3.33 


拉 马 努 金 的 的 士 数 。 拉 马 努 金 ( Srinivasa Ramanujan) 是 印度 的 数学 家 ， 因 为 对 数字 的 直觉 而 
闻名 。 当 英国 数学 家 G.H. Hardy 有 一 天 来 拜访 他 时 ，Hardy 表示 出 租车 的 号 码 是 1729， 是 一 
个 毫 无 意义 的 数字 。Ramanujan 回答 :“ 不 ，Hardy， 这 是 一 个 非常 有 意思 的 数字 a 它 可 以 分 解 
成 两 个 数字 的 立方 之 和 ， 并 且 是 有 两 种 不 同 分 解 方法 的 最 小 自然 数 (1729=1:+12:=9"+10， 后 
来 这 类 数 称 为 的 士 数 一 一 译 者 注 )。” 通 过 编写 三 个 程序 ， 输 入 一 个 int 型 的 命令 行 参数 n， 并 
打印 小 于 或 等 于 n 的 的 士 数 ， 以 证 明 拉 马 努 金 的 结论 是 否 正确 。 换 句 话 来 说 ， 找 到 不 同 整 数 
a、b、c 和 d， 使 得 ec+p=c+d。 你 可 能 需要 使 用 四 个 嵌 套 的 循环 。 

校 验 和 。 国 际 标准 书号 ( International Standard Book Number，ISBN) 是 一 个 10 位 数 的 编号 ， 
是 一 本 书 的 唯一 编号 。 这 个 编号 中 ， 最 右 侧 的 数字 是 校 验 位 ， 是 可 以 通过 其 他 9 位 数字 唯一 
确定 的 。 具 体 的 计算 方法 是 : 计算 1di+2dz+3d+…+10do， 得 到 的 结果 必须 是 1 的 倍数 (这 
里 的 di 表示 从 右 侧 开始 的 第 i 位 数字 )。qdi 就 是 校 验 和 数字 , 它 的 取 值 范围 为 0 到 10 之 间 的 
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任何 值 。ISBN 还 规定 使 用 字符 “X” 来 表示 10。 例 如 ， 对 应 于 020131452 的 校 验 和 数字 是 5， 
因为 5 是 能 够 让 下 式 值 为 11 的 倍数 ， 且 处 于 0 到 10 之 间 的 x 的 唯一 值 。 
10 . 0+9 .217 .1+6 .3+5。1+4.。4+3。5+2。2+1 .zx 

编写 一 个 程序 ， 输入 9 位 int 型 的 命令 行 参数 ， 计 算 校 验 和 ， 并 打印 ISBN 码 。 
计算 素数 。 编 写 一 个 程序 PrimeCounter， 输 入 一 个 int 型 命令 行 参数 n， 找 到 小 于 或 等 于 n 的 
所 有 素数 。 使 用 它 打 印 出 小 于 或 等 于 1000 万 的 素数 。 注 意 : 如 果 不 仔细 设计 求解 的 方法 ， 你 
的 程序 可 能 无 法 在 合理 的 时 间 内 得 出 结果 ! 
二 维 无 规则 运动 。 二 维 无 规则 运动 可 以 模拟 粒子 在 网 格 中 移动 的 行为 ， 在 每 一 个 模拟 的 步骤 
中 ， 粒 子 都 会 以 1/4 的 概率 向 东 、 南 、 西 、 北 四 个 方向 移动 ， 与 之 前 的 移动 方向 无 关 。 编 写 一 
个 RandomWalker 程序 ， 输 入 一 个 int 型 的 命令 行 参数 n， 假设 粒子 起 始 时 停 在 一 个 2nX2n 的 
正方 形 的 中 心 ， 估 算 需 要 多 长 时 间 才 能 到 达 正 方形 的 边界 。 
章 数 函数 。 假 设 x 是 一 个 double 类 型 的 正 数 变量 。 编 写 一 段 程序 ， 根 据 泰 勒 级 数 展开 式 计算 
指数 函数 ， 计 算式 为 =1+x+ 基 二 车 +…。 

答案 : 本 练习 的 目的 是 让 你 考虑 如 何 使 用 基本 的 运算 类 型 实现 类 似 Math.exp( 的 函数 。 
尝试 给 出 你 自己 的 解决 方案 ， 然 后 与 这 里 给 出 的 方案 进行 比较 。 

我 们 首先 考虑 如 何 计 算 展 开 式 中 的 一 项 。 我 们 用 变量 term 来 表示 一 项 ,假设 x 和 term 都 
是 double 类 型 的 变量 ，n 是 一 个 int 类 型 的 变量 ， 以 下 代码 片段 将 用 于 计算 学， 并 将 结果 保存 
在 term 中 。 计 算 方法 非常 直接 ， 使 用 一 个 循环 计算 分 子 ， 另 一 个 循环 计算 分 母 ， 然 后 相 除 得 
到 结果 : 


double num = 1.0, den = 1.0; 

for (Cint 1 = 1; i <= ni i++) num *= X; 
for (Cint i = 1; 1 <= Nn; i++) den *= i; 
double term = num/den; 


一 个 更 好 的 方法 是 只 使 用 一 个 for 循环 : 


double term = 1.0; 
fori(i= 1; i x ny 184) term eX/i; 


除了 更 紧凑 和 简洁 之 外 ， 后 一 种 解决 方案 还 有 一 些 优点 ， 因 为 它 可 以 避免 因 大 量 计算 造 
成 的 不 准确 ,例如 ， 像 x=10 和 n=100 这 样 的 值 ， 双 循环 的 方法 就 会 产生 误差 ， 因 为 100 ! 太 
大 了 ,不 能 使 用 双 精 度 浮 点 数 来 表示 。 

为 了 计算 e， 我 们 再 使 用 一 个 for 循环 来 组 套 之 前 的 for 循环 : 


double term = 1.0; 
double sum = 0.0; 
for (int n = 1; sum != Sum + term; n++) 
{ 
sum += term; 
term = 1.0; 
for Cint 1 = 1; i <= Nn; i++) term *= Xx/i; 


} 


循环 迭代 的 次 数 取决 于 每 一 项 的 值 与 累加 和 的 相对 大 小 。 一 旦 sum 的 值 不 再 变化 ， 我 们 
就 退出 循环 (这 个 策略 比 使 用 循环 、 条 件 判断 (term>0 ) 更 有 效 ， 因 为 它 避 免 了 大 量 的 不 会 改 
变 sun 值 的 迭代 )。 这 一 部 分 代码 是 有 效 的 , 但 是 它 的 效率 非常 低 ， 因 为 在 外 部 的 for 循环 的 
每 一 次 迭代 中 ， 内 部 的 for 循环 都 会 重新 计算 先前 迭代 中 计算 过 的 所 有 值 。 我 们 可 以 利用 在 前 
一 循环 迭代 计算 出 的 term 值 ， 使 用 一 个 for 循环 来 解决 问题 : 
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double term = 1.0; 
double sum = 0.0; 
for (int n = 1; sum != Sum + term; n++) 
{ 
sum += term; 
term *= x/n; 


} 
三 角 函 数 。 本 它们 使 用 泰勒 展开 式 计算 正弦 和 余弦 函数 。 
Sin X=X— 条 pa cos x=1— pn 


实验 分 析 。 通 过 实验 来 分 析 我 们 给 出 的 Math.exp0) 的 几 种 实现 方法 的 相对 性 能 。 练 习 1.3.38 
中 计算 天 的 方法 有 几 种 : 直接 用 柑 套 for 循环 的 方法 、 使 用 单个 for 循 环 的 改进 方法 ， 以 及 在 
此 基础 上 使 用 的 改进 的 循环 连续 条 件 (term>0 ) 的 方法 。 通 过 改变 命令 行 参数 的 方法 来 试 错 运 
行 ， 对 于 这 三 种 不 同 的 实现 方法 ， 看 看 你 的 计算 机 在 10s 内 能 够 完成 计算 的 次 数 。 
佩 皮 斯 问题 。 在 1693 年 ， 塞 缪 尔 : 佩 皮 斯 (Samuel Pepys) 问 艾 萨 克 ' 牛顿 : 掷 6 次 货 子 至 少 
一 次 得 到 1 和 掷 12 次 山 子 至 少 两 次 获得 1， 哪 个 可 能 性 更 大 ? 编写 一 个 程序 ， 帮 助 牛 顿 快速 
地 找到 答案 。 

游戏 模拟 。 在 游戏 节目 “ Let's Make a Deal ”中 ， 一 个 参赛 者 会 面 对 三 扇 门 ， 只 有 一 个 门 后 面 
是 一 个 有 价值 的 奖品 。 在 参赛 者 选择 一 扇 门 后 ， 主 持 人 打开 其 余 两 扇 门 中 的 一 扇 (当然 打开 的 
门 中 不 会 有 奖品 )。 人 参赛 者 此 时 有 机 会 转向 另外 一 个 未 打开 的 门 。 参 赛 者 应 该 这 样 做 吗 ? 按照 
直觉 来 看 ， 参 赛 者 初次 选择 的 门 和 其 他 未 打开 的 门 都 有 可 能 包含 奖品 ， 两 者 的 概率 是 相同 的 ， 
因此 没有 动机 去 切换 。 编 写 MonteHall 程序 ， 模 拟 测试 你 的 这 个 直觉 。 你 的 程序 应 该 需要 一 
个 命令 参数 n， 然 后 使 用 两 个 策略 (切换 或 者 不 切换 ) 进行 n 次 游戏， 并 打印 每 种 策略 成 功 的 
概率 。 

5 个 数 的 中 位 数 。 编 写 一 个 程序 ， 将 5 个 不 同 的 数 作为 命令 行 参数 ， 并 打印 其 中 位 数 (有 两 个 
数字 比 它 小 ， 另 外 两 个 比 它 大 )。 附 加 要 求 : 对 于 任何 一 组 输入 ， 程 序 中 发 生 的 比较 都 应 小 于 
了 Ra 

排序 三 个 数 。a、b、c 和 t 都 是 int 类 型 的 变量 , 解释 以 下 代码 为 什么 能 将 a、b 和 < 按照 升序 
来 排 定 。 


iF Ca > Bt sa bt 》 
44 (a S06) { Tt a aa mC C= ti } 
(Dc) tt brhisaece t= tt 


混乱 。 用 程序 实现 下 面 的 人 口 增长 简易 模型 ， 并 将 它 应 用 于 研究 一 个 池塘 里 的 鱼 、 测 试 试管 
中 的 菌 类 和 其 他 类 似 情况 。 我 们 假设 人 口 在 0 (灭绝 ) 到 1 (可 维持 的 最 大 人 口 ) 之 间 波 动 。 如 
果 在 1 时 刻 人 口 数量 是 x， 我 们 假设 在 tt+1 时 刻 人 口 数量 是 rx(1-x)， 参 数 ”被 称 为 繁殖 率 ， 用 
于 控制 人 口 增长 的 速率 。 从 一 个 很 小 的 人 口 数量 开始 ， 如 x=0.01， 研 究 不 同 的 + 值 在 迭代 的 
过 程 中 对 人 口 的 影响 。 要 想 使 人 口 稳定 在 x=1-1/r, + 值 应 该 是 多 少 ? 当 + 为 3.5、3.8、5 时 ， 
人 口 数量 会 发 生 什 么 ?说 说 你 的 见解 。 

欧 拉 和 需 方 数 和 的 猜想 。 在 1769 年 ， 莱 昂 哈 德 . 欧 拉 (Leonhard Euler) 提出 了 广义 的 费 马 大 定 
理 ， 猜 想 认为 至 少 需 要 nn 个 n 次 究 数 相 加 ， 它 们 的 和 才 可 能 是 一 个 nn 次 窜 数 (n>2 )。 编 写 一 
个 程序 来 反驳 欧 拉 的 猜想 (事实 上 这 个 猜想 直到 1967 年 才 被 推翻 )， 使 用 五 层 垦 套 循环 找到 
4 个 整数 ， 其 5 次 方 的 和 是 男 一 个 正 整 数 的 5 次 短 方 。 也 就 是 说 ， 找 到 a、b、c、d 和 e 使 得 
a5+b5+Hc5+d=e5s。 使 用 long 数据 类 型 。 
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1.4 数组 


在 本 节 中 ,我们 将 介绍 数据 结构 ( data structure) 的 概念 ， 并 构造 你 的 第 一 个 数据 结 
构 一 一 数组 。 数 组 的 主要 目的 是 便于 存储 和 处 理 大 量 的 数据 。 数 组 在 许多 数据 处 理 任务 中 起 
着 至 关 重 要 的 作用 ， 它 们 也 可 以 与 向 量 和 矩阵 相对 应 ， 向 量 和 和 抢 阵 广泛 用 于 科学 和 科学 编 
程 。 我 们 将 探讨 Java 数组 中 的 基本 属性 ， 并 使 用 大 量 例子 来 说 明 数 组 的 使 用 方法 。 

数据 结构 是 计算 机 中 数据 组 织 的 一 种 方式 (通常 是 为 了 节省 时 间或 者 空间 )。 数 据 
结构 在 计算 机 编程 中 起 着 至 关 重 要 的 作用 ， 在 本 书 的 第 4 章 中 将 会 讨论 各 种 经 典 的 数据 
结构 。 

一 维 数组 (也 简称 为 数组 ) 是 一 种 数据 结构 ， 用 于 存储 数值 的 一 个 序列 ， 这 个 序列 中 值 
的 类 型 都 是 相同 的 。 我 们 将 数组 中 的 每 一 个 值 称 为 它 的 一 个 元 素 。 我 们 使 用 索引 来 引用 数组 
中 的 元 素 : 如 果 一 个 数组 中 包含 个 元 素 ， 那 么 我 们 将 元 素 按 从 0 到 n-1 编号 ， 以 便 我 们 可 
以 用 一 个 整数 ( 取 值 范围 在 0 到 -1 之 间 ) 作 索 引 来 明确 指定 其 中 的 每 一 个 元 素 。 

二 维 数组 是 以 一 维 数组 为 元 素 组 成 的 数组 。 一 维 数组 的 元 素 是 由 一 个 整数 索引 的 ， 因 而 
二 维 数组 的 元 素 由 一 对 整数 索引 : 第 一 个 索引 指定 行 , 第 三 个 索引 指定 列 。 

通常 ， 当 我 们 有 大 量 的 数据 需要 处 理 时 ， 我 们 首先 把 所 有 数据 放 到 一 个 或 者 
多 个 数组 中 。 接 下 来 ， 我 们 使 用 索引 来 引用 每 个 独立 的 元 素 并 处 理 数据 。 我 们 需 
要 处 理 的 数据 可 能 有 考试 成 绩 、 股 票 价格 、DNA 链 中 的 核 苷 酸 或 书 中 的 字符 等 。 
在 这 些 例子 中 都 包含 了 大 量 相 同类 型 的 值 ， 是 数组 的 典型 应 用 场景 。 我 们 在 1.5 
节 中 讨论 输入 /输出 ， 在 1.6 节 中 进行 案例 分 析 ， 在 这 些 章节 中 我 们 都 会 对 这 些 例 
子 进行 仔细 分 析 。 在 本 节 中 ， 我 们 通过 探讨 一 些 例 子 来 展示 数组 的 基本 属性 。 我 
们 的 程序 首先 使 用 从 实验 研究 中 计算 出 的 值 来 填充 数组 ， 然 后 再 对 其 进行 处 理 。 

Java 中 的 数组 ”在 Java 程序 中 创建 一 个 数组 涉及 三 个 不 同 的 步 又: 

。 声明 一 个 数组 。 

。 创建 一 个 数组 。 

。 初始 化 数组 中 的 元 素 。 

要 声明 一 个 数组 ， 你 需要 为 它 指定 一 个 名 称 并 指明 它 所 包含 的 数据 类 型 。 要 创建 一 个 数 
组 ， 你 需要 指定 它 的 长 度 (元 素 的 数量 )。 要 初始 化 一 个 数组 ， 你 需要 给 它 的 每 个 元 素 赋值 。 
例如 下 面 的 代码 创建 了 一 个 包含 个 元 素 的 数组 ， 其 类 型 是 double 型 ， 其 中 的 元 素 被 初始 
化 为 0.0: 

double[] a; // 声明 数组 

a = new double[n]; /7 创建 数组 


for Cint i = 0; i < ni i++) AY 初始 化 数组 
a[i] = 0.0; 








第 一 个 语句 是 数组 声明 ， 它 和 基本 类 型 变量 的 声明 几乎 一 样 ， 除 了 类 型 名 称 后 面 要 有 一 
对 方 括号 ,， 它 用 于 表明 正在 声明 的 是 一 个 数组 。 第 二 个 语句 是 创建 数组 ， 它 使 用 关键 字 new 
来 分 配 内 存 ， 用 于 存储 指定 数量 的 元 素 。 对 于 基本 类 型 的 变量 不 需要 此 操作 ,但 是 在 Java 
中 ,除了 基本 类 型 外 其 余 所 有 类 型 数据 都 需要 这 个 操作 (参见 3.1 节 )。for 循环 为 数组 中 的 
每 个 元 素 都 赋值 为 0.0。 我 们 通过 在 数组 名 后 面 的 方 括号 中 放 入 索引 来 引用 数组 中 的 每 个 元 
素 : 代码 afi] 表示 的 是 引用 数组 a[] 中 的 第 i 个 元 素 (在 本 书 中 ,我 们 使 用 符号 a[] 来 表示 变 
量 a 是 一 个 数组 ,但 是 在 Java 中 我 们 不 使 用 a[])。 


使 用 数组 的 明显 优点 是 一 次 可 以 定义 许多 变量 ， 而 不 需要 一 个 一 个 明确 声明 它们 。 例 
如 ， 如 果 你 想 处 理 8 个 类 型 为 double 型 的 变量 ， 你 可 以 这 样 声 明 它们 : 


double a0，al，a2，a3，a4，a5，a6，a7; 


然后 用 a0、al 、a2 等 等 来 引用 它们 。 以 这 种 方式 命名 数 十 个 单独 变量 已 经 非常 麻烦 ， 命 名 

数 百 万 个 这 样 的 变量 就 更 无 法 应 对 了 。 使 用 数组 可 以 解决 这 类 问题 ， 你 可 以 通过 double[] 

a=new double[n] 这 样 的 语句 来 声明 n 个 变量 ， 并 且 用 诸如 a[0] 、a[1]、a[2] 等 等 来 引用 它们 。 

用 这 个 方法 可 以 很 容易 地 定义 几 十 个 或 几 百 万 个 变量 。 此 外 ， 因 为 你 可 以 使 用 变量 (或 者 其 

他 表达 式 的 运行 时 计算 结果 ) 作为 数组 的 索引 ， 所 以 就 像 上 面 那样 的 循环 ， 可 以 用 来 处 理 任 

意 多 个 元 素 。 数 组 中 的 每 一 个 元 素 都 可 以 看 作 一 个 单独 的 变量 ， 你 可 以 在 一 个 表达 式 中 使 用 
[91] 它们， 也 可 以 在 赋值 语句 中 的 左 侧 使 用 它们 。 

下 面 是 关于 数组 的 第 一 个 例子 ， 我 们 使 用 数组 来 表示 向 量 。 我 们 会 在 3.3 节 详 细 介绍 向 
量 ; 就 目前 而 言 ， 你 可 以 将 向 量 看 作 一 连 串 的 数字 。 两 个 向 量 (长 度 相等 ) 的 点 积 是 它们 相 
应 元 素 的 乘积 之 和 。 向 量 可 以 用 一 维 数组 x[]、y[] 来 表示 ， 如 果 每 个 向 量 的 长 度 是 3， 它 们 
的 点 积 可 以 表示 为 x[0]*y[0]+ x[1]*y[1]+ x[2]*y[2]。 如 果 每 个 数组 的 长 度 是 n， 那 么 下 面 代 
码 可 以 用 来 计算 它们 的 点 积 : 

double sum = 0.0; 


for (int i = 0; i < n; i++) 
sum += x[i]*y[i]; 


可 以 看 到 ， 数 组 的 使 用 非常 方便 ， 也 正 因为 如 此 ， 数 组 被 大 量 运用 在 各 式 各 样 的 编程 任务 中 。 


i x[1] y[i] x[1]*y[i] sum 
0.00 
0 0.30 0.50 0.15 0.15 
1 0.60 0.10 0.06 0.21 
2 0.10 0.40 0.04 0.25 
0.25 

点 积 的 计算 过 程 


在 随后 的 表格 中 有 很 多 数组 处 理 的 代码 示例 ， 在 本 书 的 后 面 我 们 将 探讨 更 多 的 例子 ， 因 
为 在 很 多 应 用 程序 中 ， 数 组 在 处 理 数 据 中 都 扮演 了 非常 重要 的 角色 。 在 讲解 更 复杂 的 例子 
前 ,我 们 首先 介绍 一 些 使 用 数组 编程 的 重要 特性 。 

索引 由 0 开始。 数组 a[] 中 的 第 一 个 元 素 是 a[0]， 第 二 个 元 素 是 a[1]， 以 此 类 推 。 显 然 ， 
如 果 第 一 个 元 素 是 a[1]， 第 二 个 元 素 是 a[2]， 这 样 看 起 来 更 自然 ， 但 索引 以 0 开始 具有 一 定 
的 优点 ， 并 且 已 经 成 为 现代 编程 语言 中 的 使 用 惯例 。 如 果 忽 略 了 这 个 惯例 ， 通 常会 导致 数据 
访问 错位 。 这 个 错误 很 难 避 免 ， 也 很 难 调试 ， 所 以 要 小 心 ! 

数组 长 度 。 一旦 你 在 Java 中 创建 了 一 个 数组 ， 它 的 长 度 就 是 固定 的 。 需 要 在 运行 时 显 
式 创建 数组 的 原因 是 ，Java 的 编译 器 在 编译 时 还 不 清楚 需要 为 数组 预 留 多 少 空 间 ， 因 为 数组 
的 长 度 有 时 候 是 在 运行 时 才能 确定 的 。 你 不 需要 为 整 型 (int) 或 浮 点 型 (double) 变量 显 式 
分 配 内 存 ， 因 为 它们 的 大 小 是 固定 的 ， 并 且 在 编译 时 是 已 知 的 。 你 可 以 使 用 代码 a.length 来 
获得 数组 a 的 长 度 。 注 意 数组 a[] 中 最 后 一 个 元 素 应 该 是 ala.length-1]。 为 了 方便 ， 我 们 通 

[G52] 常用 一 个 整 型 变量 mn 来 保存 数组 的 长 度 。 
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double[] a = new doubler[n]; 
创建 一 个 填充 了 随机 数 的 数组 for Cint 1 = 0; i < n; i++) 
a[i] = Math.random( ); 


for (int i = 0; i < ni i++) 


硬 教 组 值 _ 每 行 一 从 元 事 
打印 数组 值 , 每 行 一 个 元 素 System.out .printin(a[i]): 





double max = Double.NEGATIVE_INFINITY:; 
找到 数组 中 的 最 大 值 kor.(int 1 =n0s ECng 计 t 
if (a[i] > max) max = a[i]; 


double sum = 0.0; 

for (int i = 0; i < n; i++) 
sum += a[i]; 

double average = sum / ni; 


计算 数组 元 素 的 平均 值 


for (int i = 0; i < n/2; i++) 
{ 

double temp = a[i]; 

aci] = afn=1=1]; 

a[n-i-1] = temp; 
} 


double[] b = new double[n]; 
将 一 个 序列 拷贝 到 另 一 个 数组 中 for (int 1 = 0; i < n; i++) 
b[i] = a[i]; 


典型 的 数组 处 理 代 码 (假设 all 是 n 个 double 类 型 值 的 数组 ) 


颠倒 数组 中 元 素 的 顺序 


数组 的 默认 初始 化 。 为 了 减少 代码 ， 我 们 经 常 利用 Java 的 默认 数组 初始 化 语句 来 一 次 
性 完成 数组 的 声明 、 创 建 和 初始 化 操作 。 例 如 ， 以 下 语句 等 同 于 本 节 “ Java 中 的 数组 ”下 
的 代码 : 


double[] a = new double[n]; 


等 号 左边 的 代码 是 数组 声明 ; 右边 的 代码 是 数组 创建 。 在 这 种 情况 下 不 使 用 for 循环 赋 
初始 值 也 是 可 以 的 ， 因 为 Java 会 自动 将 任何 基本 类 型 的 数组 元 素 初始 化 为 0 (对 于 数字 类 
型 ) 或 false( 对 于 布尔 类 型 )。Java 也 会 自动 将 String 类 型 的 数组 元 素 (以 及 其 他 非 基 本 类 型 ) 
初始 化 为 null (null 是 一 个 特殊 的 值 ， 你 将 在 第 3 章 中 学 到 它 )。 

内 存 表 示 。 数 组 是 一 种 基础 数据 结构 ， 可 以 在 计算 机 内 存 中 找到 直接 的 对 应 形式 。 一 个 
数组 的 所 有 元 素 在 内 存 中 的 存储 是 连续 的 ， 因 此 很 容易 快速 访问 数组 中 的 值 。 事 实 上 ， 我 们 
可 以 将 内 存 本 身 看 作 一 个 巨大 的 数组 。 在 现代 计算 机 中 ， 内 存 硬 件 上 就 是 一 连 串 存储 单元 ， 
每 个 单元 都 有 一 个 对 应 的 位 置 索 引 ， 可 以 通过 这 个 位 置 索引 作为 索引 来 访问 这 个 单元 。 当 讨 
论 计 算 机 内 存 相 关 问 题 时 ， 我 们 通常 将 这 个 位 置 索 引 称 为 存储 单元 的 地 址 。 对 于 一 个 数组 
a， 为 了 便于 理解 ， 我 们 可 以 认为 a 中 存储 的 是 数组 第 一 个 元 素 a[0] 的 内 存 地 址 。 为 了 便于 
说 明 ， 假 设计 算 机 的 内 存 是 由 .1000 个 存储 单元 组 成 的 ， 它 们 的 地 址 分 别 是 从 000 到 999 (这 
个 简化 的 模型 忽略 了 一 个 事实 ， 即 数组 元 素 可 以 根据 其 类 型 占用 不 同 大 小 的 内 存 ， 但 是 现在 
可 以 忽略 这 样 的 细节 )。 现在 假设 一 个 由 8 个 元 素 构成 的 数组 被 存储 在 内 存 地 址 523 到 530 
中 。 在 这 种 情况 下 ，Java 将 会 把 第 一 个 元 素 的 内 存 地 址 (索引 ) 与 数组 长 度 一 起 存储 在 内 
存 的 某 处 。 我 们 将 这 个 地 址 称 为 指针 ， 并 说 它 指向 被 引用 元 素 的 内 存 位 置 。 当 我 们 指定 af] 
时 ， 编 译 器 会 通过 将 索引 i 加 上 af] 的 内 存 地 址 来 实现 对 所 需 值 的 访问 。 例 如 , Java 代码 a [4] 
将 生成 机 器 码 ， 以 查找 内 存 位 置 523+4=527 处 的 值 : 访问 数组 的 第 ii 个 元素 是 二 个 高 效 的 
操作 ， 因 为 它 只 需要 对 两 个 整数 值 进行 相 加 ， 然 后 访问 对 应 的 地 址 ,仅仅 是 两 个 内 存 操作 。 
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内 存 分 配 。 当 你 使 用 关键 字 new 来 创建 一 个 数组 时 ，Java 会 在 内 存 中 预 


存储 指定 数量 的 元 素 。 这 个 过 程 称 为 内 存 分 配 。 在 程序 中 使 用 的 任何 变量 都 
需要 一 个 这 样 的 过 程 (但 是 由 于 Java 知道 需要 分 配 多 少 内 存 给 基本 类 型 变 
量 ,， 因 此 不 需要 使 用 关键 字 new 来 创建 基本 类 型 )。 现 在 请 注意 ， 在 访问 数 
组 的 任何 元 素 之 前 ， 你 必须 先 创建 这 一 个 数组 。 如 果 你 不 遵守 这 个 规则 ， 你 
将 在 编译 时 遇 到 一 个 变量 未 初始 化 (uninitialized variable) 的 错误 。 

边界 检查 。 使 用 数组 编程 的 时 候 一 定 要 当心 。 引 用 数组 元 素 时 ， 你 有 责 
任 保 证 使 用 有 效 的 索引 来 引用 数组 元 素 。 如 果 你 创建 了 一 个 长 度 为 n 的 数组 
并 使 用 值 小 于 0 或 大 于 n-1 的 索引 ， 你 的 程序 在 运行 时 将 会 自动 中 止 ， 并 显 
示 一 个 ArrayIndexOutOfBoundsException 异常 (这 种 错误 叫 作 缓冲 区 溢出 ， 
在 很 多 编程 语言 中 ， 系 统 是 不 会 检测 这 种 错误 的 。 这 种 未 检测 的 错误 可 能 会 
是 你 调试 过 程 的 辟 梦 ， 但 开发 人 员 常 常 忽视 这 种 错误 并 在 已 完成 的 程序 中 留 
下 潜在 的 危险 。 你 可 能 会 惊讶 地 发 现 这 样 的 错误 可 以 被 黑客 利用 来 控制 一 个 
系统 甚至 个 人 计算 机 以 传播 病毒 、 窃 取 个 人 信息 或 者 制造 其 他 恶意 破坏 )。 
Java 提供 的 这 种 错误 消息 一 开始 可 能 会 让 你 感到 困扰 ， 但 是 为 了 获取 更 安全 
的 程序 而 付出 这 样 的 代价 是 值得 的 。 

在 编译 时 设置 数组 的 值 。 若 我 们 有 少量 的 值 需 要 在 初始 化 时 保存 在 数 
组 中 ， 那 么 可 以 在 声明 、 创 建 和 初始 化 的 过 程 中 在 一 对 大 括号 之 间 列 出 这 些 
值 ， 并 用 逗号 分 开 。 我 们 可 以 在 处 理 扑克 牌 的 程序 中 使 用 以 下 代码 : 

String[] SUITS = { "Clubs", "Diamonds", "Hearts", "Spades" }; 

String[] RANKS = 


"2 ，"3"，n4"，"5" 6", 7", "8", "g", "10", 
"Jack", "Queen", "King", "Ace" 


留 足 够 空间 来 
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现在 ， 我 们 就 可 以 使 用 两 个 数组 的 组 合 来 随机 打印 一 张 扑 克 名 称 了 ， 代 码 如 下 : 


int 1 = (int) (Math.random() * RANKS.1ength) ; 
int j = (int) (Math.random() * SUITS.length); 
System.out.printlnCRANKS[i] + " of " + SUITS[j]); 


这 段 代码 就 可 能 显示 出 “Queen of Clubs ”等 。 


这 一 段 代码 使 用 1.2 节 中 介绍 的 方法 来 生成 随机 索引 ， 然 后 使 用 索引 从 两 个 数组 中 挑选 
字符 串 。 只 要 在 编程 时 已 经 知道 了 所 有 数组 元 素 的 值 (并 且 数 组 的 长 度 不 是 太 大 )， 使 用 这 
种 方式 初始 化 数组 是 非常 有 效 的 ， 只 需要 在 数组 声明 的 过 程 中 将 所 有 的 值 放 在 等 号 右边 的 大 
括号 中 间 即 可 。 这 样 做 的 过 程 同时 也 在 暗示 创建 数组 ， 因 此 也 不 需要 关键 字 new。 

在 运行 时 设置 数组 的 值 。 更 常见 的 情形 是 我 们 希望 计算 出 数组 中 存储 的 值 ， 而 不 是 在 编 
译 前 就 确定 下 来 。 在 这 种 情况 下 ,我 们 可 以 使 用 赋值 语句 对 数组 中 的 任何 一 个 元 素 赋值 ， 赋 值 
的 过 程 就 像 其 他 赋值 语 名 一样 ， 只 是 语句 的 左 侧 是 由 数组 名 和 索引 组 成 的 。 例 如 ， 我 们 可 以 使 
用 下 面 的 代码 来 初始 化 一 个 长 度 为 52 的 数组 来 代表 一 副 扑 克 牌 〈 使 用 刚刚 定义 的 两 个 数组 ): 


String[] deck = new String[RANKS .1ength * SUITS.1ength] ; 
for (int i = 0; i < RANKS.1length; i++) 
for (Cint j = 0; j < SUITS.length; j++) 
deck[SUITS.length*i + j] = RANKS[i] + "of " + SUITS[j]; 
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在 这 段 代 码 被 执行 完毕 以 后 ， 如 果 你 按照 deck[0] 到 deck[51] 的 顺序 打印 deck[] 的 内 
， 你 会 得 到 以 下 形式 的 输出 结果 : 


2 of Clubs 

2 of Diamonds 
2 of Hearts 

2 of Spades 

3 of Clubs 

3 of Diamonds 


蝶 


Ace of Hearts 
Ace of Spades 


交换 数组 中 的 两 个 值 宫 在 编程 时 ,“ 有 时 我 们 会 希望 交换 数组 中 的 两 个 元 素 的 值 。 继 续 
使 用 扑克 有 牌 的 例子 ， 以 下 代码 使 用 了 我 们 在 1.2 节 中 使 用 过 的 方法 来 交换 第 i 和 第 j 处 的 扑 
克 牌 。 


String temp = deck[i]; 

deck[i] = deck[j]; 

deck[j] = temp; 

例如 ， 如 果 我 们 对 前 面 例子 中 的 deck [] 数 组 运行 这 段 代 码 ， 假设 i 等 于 1、j 等 于 
4， 那 么 运行 之 后 它 将 使 得 deck[1] 中 存储 着 “3 of Clubs”， 在 deck[4] 中 存储 着 “2 of 
Diamonds”。 你 也 可 以 试 一 下 ， 当 i 和 j 相等 时 ， 这 段 代码 运行 后 不 会 对 数组 的 值 产生 任何 
改变 。 所 以 当 我 们 使 用 这 一 部 分 代码 时 ， 我 们 只 是 在 改变 数组 中 值 的 顺序 ， 而 将 数组 作为 一 
个 集合 来 看 时 ， 它 并 没有 发 生变 化 。 

数组 元 素 混 洗 。 以 下 代码 可 以 实现 对 我 们 扑克 牌 数 组 中 值 的 混 洗 : 

int n = deck.length; 


for (Cint 1 = 0; i < ni i++) 


int r = i + (int) (Math.random() * (n-i)); 
String temp = deck[i]; 
deck[i] = deck[r]; 
deck[r] = temp; 
} 


我 们 每 次 从 deck[i] 到 deck[n-1] 中 随机 抽取 一 张 扑 克 牌 (每 张 扑 克 牌 的 可 能 性 相同 )， 
将 它 与 deck[i] 中 的 值 进行 交换 ， 这 一 操作 对 所 有 扑克 有 牌 从 左 到 右 依次 执行 。 这 一 部 分 代码 
比 所 看 起 来 的 要 复杂 : 首先 ， 我 们 要 保证 混 洗 后 和 洗 牌 前 的 扑克 有 牌 是 相同 的 ; 其 次 ,我 们 每 
次 都 是 从 尚未 选择 的 牌 中 来 选择 一 张 牌 进行 交换 ， 并 且 选 择 的 概率 是 均等 的 ， 以 此 来 确保 洗 
牌 是 随机 的 。 

无 须 交 换 的 取样 。 在 许多 情况 下 ， 我 们 想 要 从 一 个 集合 中 随机 抽取 一 个 样本 ， 且 原来 集 
合 中 的 成 员 在 样本 中 最 多 出 现 一 次 。 很 多 游戏 都 是 这 样 的 采样 过 程 ， 如 从 篮子 里 面 抽 取 一 个 
带 数字 的 乒乓 球 进 行 抽奖 ， 或 者 从 一 副 扑 克 牌 中 抽取 一 手 牌 。 程 序 Sample (程序 1.4.1 ) 展 
示 了 如 何 进行 抽样 ， 这 里 使 用 的 核心 方法 和 我 们 在 实现 混 洗 时 使 用 的 底层 基本 操作 是 一 样 
的 。 它 需要 两 个 命令 行 参数 m 和 n， 并 创建 一 个 长 度 为 n 的 数列 ， 数 列 中 随机 排列 着 从 0 到 
n-1 的 整数 ， 每 个 数字 只 出 现 一 次 ， 将 数列 中 的 前 m 个 元 素 作为 一 个 随机 采样 的 结果 进行 输 
出 。 为 了 便于 理解 这 个 处 理 过 程 ， 下 面 展 示 的 是 每 个 主 循环 的 迭代 结束 时 perm[] 数组 的 内 
容 (假设 m 和 hn 的 值 分 别 是 6 和 16 )。 
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perm[] 

i 0 入 后 24:35 4 556 70.85 9510: 1382503AAI 

和 
0 9 人 
TS 3 1 和 5 
五 -二 和 三 3 不 
这 9 
A a 人 
BB a O10 A 2 2 14 15 

[Rl 6 7E "30 10 4 12 2 14. 15 


运行 命令 “java Sample 6 16” 的 追踪 结果 


程序 1.4.1 无 须 交 换 的 采样 
public class Sample 


public static void main(String[] args) 
{ / 打印 m 个 整数 的 随机 采样 
/ 从 0:…n-1 (不 重复 ) 
int m = Integer.parseInt(args[0]); 
int n = Integer.parseInt(args[1]); 


int[] perm = new int[n]; m 采样 大 小 

/初始 化 a 

for ree j< nT jt) perm[] | 0 到 n-1 的 排列 
perm[j] = j; ; ; 

// 采样 


for (int 1 = 0; i < mi i++) 
// 在 perm[i] 的 右边 随机 选 一 个 数 与 之 交换 
int r = i + (int) (Math.random() * (n-i1)); 
int t = perm[r]; 
perm[r] = perm[i]; 
perm[i] = t; 
} 
// 打印 采样 结果 
for (int i = 0; i1 < m; i++) 
System.out.print(perm[i] + " "); 
System.out.print1ln(); 


本 程序 需 输入 两 个 命令 行 参数 m 和 n， 并 产生 一 个 m 个 整数 的 随机 采样 ， 分 布 
在 0 到 n-1 之 间 。 这 个 过 程 不 仅 适用 于 州 和 地 方 彩票 ， 也 能 用 于 各 种 科学 应 用 中 。 
如 果 第 一 个 参数 等 于 第 二 个 参数 ， 则 输出 结果 是 整数 从 0 到 n-1 的 随机 排列 。 如 果 
第 一 个 参数 大 于 第 二 个 参数 ， 程 序 将 以 ArrayOUtOfBoundsException 异 常 结束 。 


% java Sample 6 16 

95131118 

% java Sample 10 1000 

656 488 298 534 811 97 813 156 424 109 


% java Sample 20 20 
612981319024518114161737111015 


在 上 面 的 程序 中 ,假定 变量 + 在 给 定 范围 内 使 取 值 的 概率 相等 ， 那么 在 处 理 结束 后 perm[0] 
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到 perm[m-1] 的 值 是 一 个 均匀 的 随机 采样 (即使 其 中 的 一 些 元 素 可 能 被 移动 了 多 次 )， 因 为 
样本 中 的 每 个 元 素 都 是 从 那些 尚未 采样 的 值 中 随机 选取 一 个 值 。 计算 这 种 随机 采样 数列 的 男 
一 个 重要 用 途 是 ， 可 以 把 这 个 随机 采样 数列 的 值 作为 索引 ， 用 来 实现 对 任意 一 个 数组 随机 的 
采样 。 这 么 做 的 原因 可 能 是 ， 那 个 竺 采样 的 数组 出 于 某 种 原因 无 法 进行 重新 排列 ， 在 这 种 情 
况 下 ， 间 接 的 进行 采样 就 是 一 个 不 错 的 方案 。( 例 如 , 某 公司 可 能 希望 对 客户 列表 抽取 随机 
样本 ， 而 客户 列表 是 按 字母 顺序 保存 的 ， 不 能 被 随意 打 乱 。) 

为 了 了 解 这 个 技巧 是 如 何 工作 的 ,假设 我 们 希望 从 我 们 的 deck[] 数组 中 随机 抽取 一 
张 扑克 牌 ， 如 上 所 述 。 我 们 使 用 采样 代码 并 使 n=52、m=5， 并 在 System.out.print() 中 将 
perm[i] 替换 为 deck[perm[i]] (将 替换 的 结果 打印 出 来 )， 输 出 如 下 : 

3 of Clubs 

Jack of Hearts 

6 of Spades 

Ace of Clubs 

10 of Diamonds 

无 论 什么 时 候 ， 只 要 我 们 想 通过 分 析 一 个 小 的 随机 样本 得 出 关于 大 群体 的 结论 ， 都 需要 这 
样 的 随机 抽样 过 程 。 随 机 采样 已 经 广泛 用 作 投 票 、 科 学 研究 和 许多 其 他 应 用 统计 研究 的 基础 。 

预先 计算 的 值 。 数 组 的 一 个 简单 应 用 是 保存 你 已 经 计算 出 来 的 值 ， 方 便 以 后 使 用 。 例 
如 ,假设 你 正在 编写 一 个 使 用 一 些 谐 波 数 执行 计算 的 程序 ( 见 程 序 1.3.5 )。 将 这 些 值 保存 在 
数组 中 是 一 个 有 效 的 方案 ， 如 下 所 示 : 


double[] harmonic = new double[n]; 
for. Gint 1 = 1 1 xn 14+) 
harmonic[i] = harmonic[i-1] + 1.0/i; 

接 下 来 你 可 以 使 用 harmonic[i] 这 样 的 代码 来 引用 第 i 个 谐 波 数 。 以 这 种 方式 预先 计算 
值 是 一 个 时 间 复 杂 度 和 空间 复杂 度 的 权衡 : 通过 增加 空间 (保存 值 )， 我们 节省 了 时 间 的 开销 
(因为 我 们 不 需要 重新 计算 值 )。 当 1n 的 值 非常 大 时 ， 这 种 方案 并 不 是 一 个 很 有 效 的 方案 , 但 
是 ， 如 果 我 们 需要 存储 的 值 数量 比较 小 ， 或 者 使 用 的 次 数 很 多 时 ， 则 这 是 一 个 很 有 效 的 方案 。 

简化 重复 的 代码 。 考 虑 下 面 的 代码 段 ， 根 据 编 号 打印 月 份 的 名 称 (1 为 1 月 份 , 2 为 2 
月 份 ， 等 等 ): 


1¥ (m== 1) System.out.println("]Jan") ; 
else if (m == 2) System.out.printin("Feb"); 
else if (m == 3) System.out.println("Mar") ; 
else if (m == 4) System.out.printin("Apr"); 
else if (m == 5) System.out.printin("May"); 
else if (m == 6) System.out.printin("Jun"); 
else if (m == 7) System.out.print1in("Jul"); 
else if (m == 8) System.out.printlin("Aug"); 
else if (m == 9) System.out.println("Sep") ; 
else if (m == 10) System.out.print1n(C"Oct") ; 
else if (m == 11) System.out.printin("Nov"); 


else if (m == 12) System.out.println("Dec"); 


我 们 也 可 以 使 用 switch 语句 ， 但 是 更 简洁 的 选择 是 使 用 由 每 个 月 的 名 称 组 成 的 字符 数组 : 
String[] MONTHS = 
{ 


"jan", "Feb", "Mar™, "Apr", "May", "Jun", 

"Jul SS "Aug", "Sep", 让 全 "Nov", "Dec" 
}; 
System.out.print1lnCMONTHS[m]) ; 
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如 果 你 在 程序 中 的 多 个 地 方 都 需要 通过 数字 来 访问 月 份 的 名 称 ， 这 种 技术 非常 有 用 。 注 
意 我 们 必须 在 数组 中 浪费 一 个 位 置 (元 素 0), 使 得 MONTHS[1] 对 应 的 是 1 月 份 。 

有 了 这 些 基 本 的 定义 和 例子 ， 现 在 我 们 可 以 考虑 两 个 应 用 程序 ， 这 两 个 程序 都 涉及 有 趣 
的 经 典 问题 ， 并 且 能 够 展示 数组 在 高 效 计算 中 基本 的 重要 作用 。 在 这 两 个 例子 中 ， 使 用 表达 
式 的 计算 结果 来 索引 数组 中 的 元 素 起 到 了 核心 作用 ， 而 且 如 果 不 使 用 这 个 技术 ， 这 些 计 算 会 
变 得 很 困难 ， 甚 至 是 无 法 完成 的 。 

卡 券 收集 ”假设 你 有 一 副 扑 克 牌 ， 并 且 你 每 次 都 均匀 随机 地 从 中 抽出 一 张 扑克 牌 (抽出 
的 不 再 放 回 )， 你 需要 抽出 多 少 张 牌 才能 保证 每 种 花色 都 被 抽 到 过 ? 你 需要 


抽出 多 少 张 牌 才 能 保证 每 种 牌 面 的 数字 都 被 抽 到 过 ? 这 就 是 著名 的 卡 券 收 ild 国 
集 问题 的 例子 。 一 般 来 说 ,假设 卡 券 交易 公司 发 行 具 及 n 种 不 同 的 卡 券 : 
你 需要 收集 多 少 张 卡 才 有 可 能 收集 到 所 有 n 种 不 同 的 卡 券 ? 假设 你 收集 的 卡 券 收集 
每 张 卡 的 可 能 性 相同 。 

卡 券 收集 不 是 一 个 幼稚 的 问题 。 例 如 ， 科 学 家 通常 想 知 道 某 个 自然 界 中 出 现 的 序列 是 否 
与 某 个 随机 序列 具有 相同 的 特征 。 如 果 是 这 样 的 话 ， 这 将 会 是 一 个 非常 有 趣 的 事情 ( 那 就 意 
味 着 在 一 些 计 算 中 自然 界 的 序列 和 随机 数 序列 可 以 相互 蔡 代 一 一 译 者 注 ); 如 果 不 是 ， 则 需 
要 进一步 调查 ， 以 寻找 数列 的 重要 模式 。 例 如 ， 科 学 家 使 用 这 种 方法 来 确定 哪些 部 分 的 基因 
组 序列 值得 研究 。 检 测 一 个 序列 中 的 数字 是 否 真 的 是 随机 的 ， 一 个 有 效 的 测试 手段 就 是 运行 
卡 券 收集 测试 ， 即 比较 找到 所 有 可 能 的 值 所 需要 访问 的 元 素数 量 是 否 与 均匀 的 随机 分 布 序列 
的 数值 相同 。CouponCollector (程序 1.4.2 ) 是 一 个 模拟 此 过 程 的 程序 ， 同 时 我 们 用 它 来 阐述 
数组 的 使 用 。 程 序 需要 输入 一 个 命令 行 参 数 n， 并 使 用 代码 (int) (Math.random() * n)( 见 程序 
1.2.5 ) 产生 一 组 0 到 n-1 的 随机 整数 序列 。 假 设 每 一 个 整数 代表 了 一 张 牌 ， 我 们 想 知道 我 们 
是 否 已 经 见 过 此 牌 。 为 了 方便 ,我 们 使 用 一 个 名 为 isCollected[] 的 数组 ， 我 们 使 用 牌 的 值 作 
为 索引 ， 如 果 第 i 张 牌 看 过 了 ，isCollected[i] 就 是 true， 否 则 就 是 false。 我 们 使 用 整数 + 来 代 
表 我 们 得 到 的 一 张 新 牌 ， 我 们 通过 访问 isCollected[r] 来 检查 我 们 是 否 之 前 见 过 这 张 牌 。 计 算 
过 程 中 需要 记录 看 到 的 卡 券 的 种 类 和 生成 的 卡 券 的 数量 ， 并 当前 者 数量 到 达 n 时 打印 出 后 者 。 
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运行 “java CouponCollector 6” 的 一 个 典型 追踪 示例 





















程序 1.4.2 ”模拟 卡 券 收集 (一 ) 


public class CouponCollector 


public static void main(String[] args) 





1// 在 [0 .fm 中 生成 随机 数 ， 直 到 找到 每 个 种 类 
int n = Integer.parseInt(args[0]); 
boolean[] isCollected = new boolean[n]; 
int count = 0; 
int distinct = 0; 


while (distinct < m) 


{ 


/生成 另 一 张 卡 券 
int r = (int) (Math.random() * n); 
Count++; 


i 

折 (!isCollected[r]) # 卡 券 的 值 
distinct++; | ; 和 : 
isCollected[r] = true; | isCollected[i] | 卡 券 是 否 被 收藏 过 ? 


} count 卡 券 的 数量 
} WN/ 找到 n 个 不 同 的 卡 券 djstinct 不 同 卡 券 的 数量 
System.out.printlnCcount); | ee -个 随机 的 卡 券 








} 
¥ 


这 个 程序 需要 在 命令 行 中 输入 一 个 整数 n 作 为 参数 ， 然 后 程序 会 生成 0 到 n-l 之 间 
的 随机 数 以 进行 卡 券 收集 过 程 的 模拟 ， 直 到 收集 所 有 可 能 的 卡 券 类 型 时 程序 结束 。 










% java CouponCollector 1000 
6583 


% java CouponCollector 1000 
6477 


% java CouponCollector 1000000 
12782673 


与 往常 一 样 ， 理 解 程序 最 好 的 方式 是 跟踪 一 个 典型 的 运行 过 程 中 变量 值 的 变化 。 这 个 过 
程 非常 容易 ， 向 CouponCollector 中 添加 一 段 代码 ， 用 来 在 每 一 个 while 循环 结束 时 输出 变 
量 的 值 。 在 附 图 中 为 了 便于 显示 ， 我 们 使 用 F 代表 false, T 代表 true。 跟 踪 使 用 庞大 数组 的 
程序 时 可 能 面临 一 个 挑战 : 当 程 序 中 有 一 个 长 度 为 n 的 数组 时 ， 它 代表 有 n 个 变量 ， 你 必须 
把 它们 全 部 列 出 来 。 跟 踪 使 用 Math.random() 的 程序 也 是 一 个 挑战 ， 因 为 每 次 运行 程序 时 都 
会 得 到 不 同 的 跟踪 结果 。 在 这 里 ， 请 注意 distinct 的 值 总 是 等 于 isCollected[] 中 true 的 数量 。 

如 果 没 有 数组 ， 当 n 非常 巨大 时 ， 我 们 无 法 想象 如 何 完成 模拟 卡 券 收集 程序 的 处 理 过 程 ; 
而 如 果 使 用 数组 来 实现 就 会 变 得 非常 方便 。 在 本 书 中 我 们 会 看 到 很 多 这 样 使 用 数组 的 例子 。 

埃 拉 托 斯 特 尼 筛 法 ”素数 在 数学 、 计 算 和 密码 学 中 扮演 着 重要 的 角色 。 一 个 素数 是 一 个 
大 于 1 的 整数 ， 其 仅 能 被 1 和 它 本 身 整除 。 素 数 的 计算 函数 wr(n) 用 于 计算 小 于 或 等 于 的 
素数 个 数 。 例 如 ，~7(25)=9， 因 为 25 之 前 包括 9 个 素数 ,分别 是 2、.3、5、.7、11、13、17、 
19 和 23。 这 个 函数 在 数论 中 起 到 核心 作用 。 

计算 素数 的 一 种 方法 是 使 用 像 Factors (程序 1.3.9 ) 这 样 的 程序 。 具 体 来 说 ， 我 们 可 以 
修改 Factors 中 的 代码 ， 如 果 给 定 的 数字 是 素数 ， 则 将 一 个 布尔 变量 置 为 true， 和 否则 设置 为 
false (而 不 再 是 把 因子 输出 )， 然 后 将 代码 放 到 循环 中 ， 该 循环 每 遇 到 三 个 素数 计数 器 就 递 
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增 1， 这 种 方法 对 于 nn 很 小 时 非常 有 效 , 但 是 对 于 nn 很 大 时 运行 
PrimeSieve (程序 1.4.3 ) 需要 输入 一 个 命令 


会 很 缓慢 。 
行 整数 参数 nm， 并 使 用 埃 拉 托 斯 特 尼 得 法 


(Sieve of Eratosthenes) 来 找到 素数 的 个 数 。 该 程序 使 用 布尔 数组 isPrime[] 来 记录 哪些 整数 
是 素数 ， 如 果 目 标 整 数 i 是 素数 ， 则 将 isPrime[i] 设置 为 true， 和 否则 设置 为 false。 和 筛选 的 工 
作 原 理 如 下 : 首先 ， 将 所 有 数组 设置 为 true， 表 示 对 于 每 一 个 整数 都 没有 找到 它 的 因子 。 然 
后 ， 从 i=2 开始 ， 直 到 i<= ni， 重复 以 下 步骤 ; 


。 找到 下 一 个 最 小 的 素数 i ( 即 没 有 找到 其 因子 的 整数 )。 
。 因为 没有 比 i 更 小 的 因子 ， 
。 将 i 的 所 有 倍数 对 应 的 isPrime[] 元 素 设置 为 false。 


设置 isPrime[i] 为 true。 


当 髋 套 for 循环 结束 时 ， 当 且 仅 当 整 数 i 是 素数 时 ，isPrime[i] 为 tue。 然 后 我 们 遍历 这 
[103] 个 数组 ， 就 可 以 计算 小 于 或 等 于 nm 的 素数 的 个 数 。 


程序 14.3“ 埃 拉 托 斯 特 尼 筛 法 


% 





public class PrimeSieve 


{ 
public static void main(String[] args) 


{ /打印 小 于 或 等 于 n 的 素数 


int n = Integer.parseInt(args[0]); 

boolean[] isPrime = new boolean[n+1]; 

for (int 1 = 2; 1 <= Nn; i++) 
isPrime[i] = true; 


for Cint>T = 2 i <= nN/i, 1++) 
{ if (isprime[i]) 
{ /WN 将 i 的 倍数 标记 为 非 素数 
Brainost <= nm/ Er) 
isPrime[i * j] = false; 
LE 
} 


// 统计 素数 个 数 

int primes = 0; 

Tor (Cint 1 a De 1 wa Wi) 
if (CisPrime[i]) primes++; 

System.out.printlnCprimes) ; 





n 
isPrime[i] 
primes 


参数 
混和 否 为 素数 ? 
素数 的 个 数 


该 程序 需要 输入 一 个 整数 型 命令 行 参 数 n 并 计算 小 于 或 等 于 n 的 素数 。 为 此 ， 
使 用 布尔 数组 isPrime 进 行 计算 ， 如 果 i 是 素数 则 设置 isPrime[i] 为 tue， 否 则 设置 为 
false。 首 先 ， 它 将 数组 的 所 有 元 素 都 设置 为 ue 来 表示 每 个 数字 初始 化 时 都 被 认为 
是 素数 。 然 后 将 非 素数 (已 知 素数 的 倍数 ) 在 对 应 数组 中 的 元 素 设置 为 false。 如 果 
< 四 在 多 轮 将 数组 的 元 素 设 置 为 ase 的 操作 后 还 是 tue， 那 么 我 们 可 以 知道 是 素数 。 
在 第 二 个 for 循 环 中 终止 测试 条 件 是 i<=n/i 而 不 是 简单 的 i<=n， 因 为 如 果 一 个 整数 


没有 小 于 zi 的 因子 ,那么 


% java PrimeSieve 25 


9 


% java PrimeSieve 100 


25 


% java PrimeSieve 1000000000 
50847534 


已 肯定 不 会 有 大 于 mi 的 因子 ， 所 以 我 们 不 必 关 注 这 样 的 
因子 。 这 种 改进 使 得 n 较 大 时 程序 的 运行 时 间 大 幅度 缩短 。 


像 往常 一 样 ， 可 以 很 容易 地 通过 添加 代码 来 打印 追踪 。 对 于 像 PrimeSieve 这 样 的 程序 ， 
你 必须 要 小 心 ， 因 为 它 包 含 了 一 个 散 套 for-if-for， 所 以 你 必须 注意 花 括 号 以 把 打印 代码 放 在 
正确 的 位 置 。 请 注意 ， 当 i>n/i 时 ， 我 们 就 停止 ， 就 像 我 们 在 Factors 中 所 做 的 那样 。 











. isPrime[] 

: 2 3 MD 7 Se I I ES "Ya" 9 LO Tr "TS FT "ZU" El We dE 
TA Mo SN A ET A 

2 FT Feep ME TS Pl TT pr nF: i epeeT 

3 了 T TT FF TT ose Te TE em/ iV -ETN CH RA 

和 
To Vo ry RT = 


运行 命令 “java PrimeSieve 25” 的 追踪 信息 


使 用 PrimeSieve， 我 们 可 以 计算 大 的 7(n)， 这 时 程序 的 限制 变 成 了 Java 允许 的 最 大 
数组 长 度 。 这 是 程序 的 时 间 和 空间 的 典型 例子 。 像 PrimeSieve 这 样 的 程序 在 帮助 数学 家 发 
展 数字 理论 方面 发 挥 了 重要 的 作用 ， 同 时 这 个 理论 还 有 很 多 其 他 重要 的 应 用 。 

二 维 数组 ”在 很 多 应 用 程序 中 ,一 种 方便 的 信息 存储 形式 是 将 数字 存储 在 规则 的 矩形 表 
格 中 ， 并 引用 表格 中 的 行 和 列 来 指定 要 访问 的 数据 。 例 如 ， 一 个 教师 可 能 需要 维护 一 个 表 
格 ， 行 对 应 于 学 生 、 列 对 应 于 成 绩 ; 科学 家 可 能 需要 维护 实验 数据 表 ， 其 中 行 代表 某 一 次 实 
验 、 列 代表 实验 结果 数据 ; 或 者 一 个 程序 员 可 能 需要 一 张 表 ， 这 张 表 的 每 一 个 元 素 是 一 个 像 
素 对 应 的 灰 度 值 或 颜色 值 ， 并 把 这 张 表 用 于 显示 某 个 图 像 。 








与 这 些 表 格 相 对 应 的 数学 抽象 是 和 矩阵; 对 应 的 Java 结构 是 一 个 二 a[1][2] 
维 教 组 。 你 可 能 已 经 遇 到 了 许多 矩阵 和 二 维 数组 的 应 用 ， 你 也 将 在 科 i 
学 、 工 程 和 计算 应 用 中 遇 到 许多 其 他 应 用 程序 ， 我 们 将 在 本 书 中 以 示例 第! 行 一 [38_57 |7 引 
的 方式 进行 阐述 。 与 向 量 和 一 维 数组 一 样 ， 许 多 最 重要 的 应 用 程序 都 涉 94 32 
及 处 理 大 量 数据 ， 等 到 我 们 在 1.5 节 中 介绍 输入 和 输出 以 后 ， 我 们 再 考 ee 
虑 这 些 应 用 程序 。 76 59 

二 维 数组 的 编程 方法 也 非常 简单 ， 对 原来 的 Java 一 维 数组 的 代码 党 
进行 扩展 即 可 。 在 二 维 数组 af][] 的 使 用 过 程 中 ， 通 常 使 用 i 来 代表 行 ， vi 
用 j 来 代表 列 ， 使 用 符号 afi][j] 来 表示 一 个 元 素 ; 声明 一 个 二 维 数 组 时 ， 第 2 列 
我 们 需要 多 加 一 对 方 括号 ; 创建 数组 时 ， 则 在 类 型 名 后 指定 行 的 数量 ， 二 维 数组 
紧 接 着 行 后 指定 列 的 数量 : 


double[][] a = new double[m] [n]; 


我 们 把 这 样 一 个 数组 称 为 mXn 的 数组 。 按 照 惯 例 ， 第 一 维 是 行 数 ， 第 二 维 是 列 数 。 
与 一 维 数组 一 样 ，Java 将 数组 中 的 所 有 数值 初始 为 0， 将 数组 中 的 所 有 布尔 值 元 素 初始 化 
为 假 。 

默认 初始 化 。 二 维 数组 的 默认 初始 化 非常 有 用 ， 因 为 它 比 一 维 数组 省 去 了 更 多 的 代码 。 
以 下 代码 等 同 于 我 们 单行 创建 和 初始 化 的 习惯 : 

double[][] a; 


a = new double[m] [n]; 
for (int i = 0; i1 < m; i++) 
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{ A 初始 化 第 ji 行 
for (int j = 0; j < n; j++) 
a[i][j] = 0.0; 


这 段 将 二 维 数组 初始 化 为 0 的 代码 是 多 余 的 ,但 是 租 套 for 循环 将 元 素 初始 化 为 其 他 
值 还 是 非常 有 用 的 。 参 考 这 段 代 码 ， 可 以 构建 出 很 多 种 访问 或 修改 二 维 数组 中 每 个 元 素 的 
代码 。 

输出 。 对 于 很 多 二 维 的 数组 处 理 操作 我 们 使 用 艇 套 for 循环 。 例 如 ， 以 表格 格式 打印 一 
个 mxn 的 数组 ,我 们 可 以 使 用 以 下 代码 : 

for (int i = 0; i < m; i++) 

{ NH 打印 第 i 行 

for (int j = 0; j < ni j++) 


System.out.print(a[i][j] + " "); 
System.out.print1n(); 


如 果 需 要 的 话 ， 我们 可 以 通过 添加 代码 ， 给 输出 的 数据 a00 
添加 行 号 和 列 号 ( 见 练习 1.4.6 )。Java 程序 员 在 编程 时 ， 通 
常 认 为 行 是 从 0 开始 自 上 到 下 递增 的 ， 列 号 是 从 0 开始 自 左 
到 右 递 增 的 。 

内 存 表示 。Java 以 数组 的 数组 来 表示 二 维 数组 ， 一 个 具 
有 区 行 和 nn 列 的 二 维 数组 ,实际 上 是 一 个 长 度 为 m 的 数组 ， 
其 中 每 个 元 素 又 是 一 个 长 度 为 n 的 一 维 数组 。 在 Java 中 的 二 
维 数组 af][] 可 以 使 用 代码 a[i] 来 引用 第 i 行 (这 是 一 个 一 维 
数组 )， 但 是 没有 相对 应 的 方法 来 引用 第 j 列 。 arsj[o|arejr|are][] 

编译 时 设置 数组 元 素 的 值 。Java 可 以 在 编译 时 初始 化 数 
组 的 值 ， 初 始 化 的 方法 就 是 紧 跟 在 数组 声明 的 后 面 列 出 元 素 一 个 10X3 的 数组 
的 值 。 如 果 将 一 个 二 维 数组 看 成 普通 的 数组 ， 每 个 元 素 占 一 
行 ， 那么 每 行 元素 都 是 一 个 一 维 数组 。 初 始 化 一 个 二 维 数组 ， es 

















[ato ro [acol cn [atol 2] | 
atojama|armcl | 
ato|aB10|ar210] | 
al[ol|a015 |aBlG] | 
arrol|ar4lG | al | 


jareJ tol [att | atel 2] 
aaar71D | az 


a[5] 一 





需要 依次 初始 化 这 些 一 维 数 组 ， 我 们 用 大 括号 括 起 一 系列 数值 0 
来 初始 化 每 个 一 维 数组 ， 然 后 用 逗号 分 隔 每 个 一 维 数组 ， 如 右 。 { 92.0' 77.0, 74.0，0.0} 
边 代码 所 示 。 { 99.0, 94.0, 92:0, 0.0 } 
电子 表格 。 数 组 的 一 个 常见 用 法 是 用 电子 表格 程序 (如 { 80.0, 76.5, 67.0，0:0} 
Excel 等 一 一 译 者 注 ) 存储 数字 表格 。 例 如 ,一 个 班 让 m { 92.0; 66.0, 91.0，0.0 } 
个 学 生 、 每 个 学 生 有 7 项 考试 成 绩 ,， 老师 需要 维护 二 不 1807 29300003 
00， 雪 507 m0, 0.0 } 


(m+1)X (n+1) 的 数组 ， 其 中 最 后 一 列 为 每 个 学 生 的 平均 考试 成 ，， 
绩 ， 最 后 一 行为 考试 的 平均 成 绩 。 尽 管 我 们 通常 在 专门 的 应 用 编译 时 初始 化 一 个 
程序 中 进行 这 样 的 计算 ， 但 是 还 是 值得 研究 数组 处 理 的 底层 代 10X3 的 双 精度 数组 
码 。 为 了 计算 每 个 学 生成 绩 的 平均 值 (每 一 行 的 平均 值 )， 需 要 将 每 一 行 元 素 的 总 和 除 以 n。 
这 样 逐 行 的 顺序 处 理 矩 阵 元 素 的 代码 被 称 为 行 主 序 : 相似 的 ,计算 每 次 考试 的 平均 成 绩 (每 
一 列 的 平均 值 )， 即 每 一 列 元 素 的 和 除 以 m。 这 样 逐 列 的 顺序 处 理 矩 阵 元 素 的 代码 被 称 为 列 
主 序 。 
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第 1 a 
ee 计算 行 的 平均 值 
二 行 平 均 数 for Cint i = 0; i < m; i++) 
99.0 [85.0| 98.0 |94:0 92+77+74 : Re 
98.0 站 79.0 0 。 并 for Cint j= 0; J < n; j++) 
sum += a[i][j]; 
a[i][n] = sum / ni; 





m=10 
计算 列 的 平均 值 


for (int j = j++) 
{ /证 并 入 列 的 my 
5 2 dou sum = 0. 

第 m 行 的 er pr i = 站 < m; i++) 
列 平 均 数 sum += a[i] [i]; 

a[m][j] = sum / m; 

85+57+,. 十 89 污 

10 


典型 的 电子 表格 的 计算 


适 阵 操作 。 和 矩阵 运算 是 科学 和 工程 中 的 典型 应 用 ， 二 维 数组 可 以 用 来 表示 矩阵， 并 用 来 
实现 各 种 数学 运算 。 即 使 这 样 的 处 理 通常 是 在 专业 的 应 用 程序 中 完成 “a0 
的 ， 但 底层 的 计算 也 是 值得 理解 的 。 例如 ， 你 可 以 按 下 面 的 方法 进行 
nXn 和 抢 阵 的 加 法 : 

double[][] ¢ = new double[n][n]; 

for (int i = 0; i < ni i++) 

for (Cint j= 03 < n; j++) 
c[i][j] = a[li][j] + b[i][j]; 

类 似 的 ， 你 也 可 以 对 两 个 矩阵 做 乘法 ， 你 可 能 已 经 学 习 过 和 矩阵 的 乘 “00 
法 ， 但 如 果 你 不 熟悉 或 者 不 记得 矩阵 的 乘法 ， 下 面 用 于 两 个 矩阵 相 乘 的 B20] 
Java 代码 基本 与 数学 定义 是 相同 的 。 如 果 a[][] 和 Pb0U0 的 乘积 记 为 c[][]， 
那么 它 的 每 个 元 素 c 自 中 是 和 矩阵 aD0] 的 第 i 行 和 矩阵 b[]0 的 第 j 列 的 点 积 。 矩阵 加 法 


double[][] c¢ = new double[n][n]; 
for Cint i = 0; i < nj i++) 


a[1][2] 
.10| 








c[1][2] 


for (Cint j = 0; j < n;.j++) 


1/ 第 i 行 和 第 j 列 做 点 积 
for Cint k= 0; k < n; k++) 
c[i][j] += a[i][k]*b[k][j]; 





} 
第 2 列 c0D=03*05 
a[][] b[][] | c[]0 Rt 
.50 us 
.40 


矩阵 乘法 


珑 阵 乘法 的 特例 。 和 矩阵 乘法 有 两 个 非常 重要 的 特例 ， 这 些 特殊 的 情况 发 生 在 其 中 一 个 矩 
阵 的 维度 是 1 (这 时 也 可 以 称 它 为 一 个 向 量 ) 的 时 候 。 一 个 特例 是 矩阵 - 向 量 乘 法 ， 即 一 个 
mXn 和 矩阵 乘 以 一 个 n 维 列 向 量 (一 个 nX1 的 矩阵 ) 将 会 得 到 一 个 mX1 的 列 向 量 (结果 中 
的 每 一 个 元 素 是 对 应 矩阵 的 行 和 向 量 的 点 积 )。 第 三 个 特例 是 向 量 - 天 阵 乘 法 ， 我 们 将 一 个 
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行 向 量 (1Xm 的 和 矩阵) 乘 以 一 个 mXn 的 矩阵 得 到 一 个 1Xn 的 行 向 量 (结果 中 的 每 一 个 元 素 
是 操作 数 向 量 和 一 个 对 应 矩阵 的 列 的 点 积 )。 这 些 操作 js gy _bp 

提供 了 一 个 简洁 的 方式 来 表示 大 量 的 矩阵 运算 。 例 如 ， for Gint 1 = 0; i < m; in 

对 于 具有 mw 行 n 列 元 素 的 电子 表格 中 行 的 平均 值 计算 相 人 Om 00 j 

当 于 和 矩阵 - 向 量 乘法 ， 其 中 行 向 量 有 nn 个 元 素 都 是 mn。 } bY sari 


同样 的 ， 电 子 表 格 中 列 的 平均 值 计算 相当 于 向 量 - 矩阵 ar b] 

乘法 ， 其 中 列 向 量 的 每 个 元 素 的 值 都 是 1/m。 在 本 章 的 380 .5 四 阁 加 

未 尾 的 重要 应 用 中 ， 我 们 还 会 讨论 向 量 - 矩阵 乘法 。 时 .入 | 开 |oe x0 | | 到 

不 规则 数组 。 实 际 上 ， 并 不 要 求 二 维 数组 中 所 有 90 46 54 四 号 | 一 行 平均 值 

行 都 有 相同 的 长 度 一 具有 不 同 长 度 的 数组 通常 被 称 |3 吕 到 | 

为 不 规则 数组 ( 见 练习 1.4.34 的 应 用 程序 示例 )。 针 对 89 29 38 52 

不 规则 数组 的 处 理 代码 需要 格外 注意 。 例 如 ， 这 段 代 

码 打印 了 不 规则 数组 的 内 容 : 向 量 -和 矩阵 乘法 y[*a[]0=c[D] 


for (int j = 0; j < n; j++) 


的 点 积 
for (int i = 0; i < a.length; i++) { “WY 和 第 j 列 点 


for (int 1 = 0; ++) 
i , . c[j] += Sieart; 
for (Cint j = 0; j < a[i].length; j++) 
System.out.print(a[i][j] + " "); WB, a rt Bie od A i 
System.out.print1n(); Po Te 
} 98 57 78 
92r -27 176 
这 部 分 代码 能 够 测试 你 对 Java 数组 的 理解 程度 ， 2 
所 以 你 应 该 花 一 定 的 时 间 来 研究 它 。 在 本 书 中 ,我 们 5 全 下 
通常 使 用 方 阵 或 者 矩阵 ， 其 维 数 由 变量 m 和 nn 给 定 。 92 66 89 
而 上 面 的 代码 中 使 用 afi].length 这 种 形式 的 代码 来 获 89 29 38 


取 数 组 长 度 ， 就 说 明 被 处 理 的 数组 一 定 是 不 规则 数组 。 a wo Hs 
多 维 数组 。 利 用 跟 二 维 数组 类 似 的 拓展 方法 ,我 人 
们 可 以 编写 任意 维度 数组 的 代码 。 例 如 ， 我 们 用 以 下 代码 声明 和 初始 化 了 一 个 三 维 数组 : 


double[][][] a = new double[n][n]j[n]; 


对 于 每 个 元 素 ， 我们 可 以 用 类 似 a[i][j][k] 进行 索引 。 

二 维 数组 为 矩阵 提供 了 一 个 自然 的 表示 形式 ， 和 矩阵 在 科学 、 数 学 和 工程 学 中 无 处 不 在 。 
它们 还 提供 了 一 个 更 自然 的 方式 来 组 织 大 量 的 数据 一 一 电子 表格 和 很 多 其 他 计算 程序 的 关键 
组 件 。 通 过 第 卡 儿 坐 标 、 二 维 或 三 维 数组 也 为 物理 世界 的 模型 提供 了 基础 。 在 本 书 中 会 有 三 
个 领域 的 示例 程序 涉及 它们 。 

示例 : 自 回避 的 随机 游 走 ( self-avoiding random walks) 假设 你 把 你 的 狗 放 在 了 一 个 
城市 中 心 的 大 街 ， 所 有 的 大 街 形 成 一 个 网 格 ， 每 条 路 看 起 来 都 差不多 。 我 们 假设 有 n 个 南北 
方向 的 街道 , 个 东西 方向 的 街道 ， 所 有 街道 都 是 有 规律 的 间隔 ， 并 且 完 全 相交 形成 一 个 格子 
模型 。 狗 会 尝试 逃离 城市 ， 在 每 个 交叉 路 口 随机 选择 方向 前 进 ， 但 是 它 可 以 通过 气味 来 避免 走 
到 已 经 走 过 的 地 方 。 但 是 ， 这 只 狗 可 能 会 陷入 死胡同 ， 这 时 除了 重新 回 到 某 个 路 口 别 无 选择 。 
在 这 种 情况 下 ， 狗 逃离 城市 的 概率 会 有 多 大 呢 ?” 这 个 有 趣 问题 是 著名 的 自 回避 的 随机 游 走 模型 
的 一 个 简单 例子 ， 它 在 聚合 物 和 统计 力学 的 研究 中 有 着 重要 的 科学 应 用 。 例 如 ， 你 可 以 用 这 个 
模型 模拟 一 个 材料 链 的 生成 过 程 ， 每 次 增长 一 点 ， 直 到 没有 增长 的 可 能 。 为 了 更 好 地 理解 这 
样 的 过 程 ， 科 学 家 们 尝试 理解 自 回避 随机 游 走 的 特性 。 


编程 无 黄 6 


狗 逃 跑 的 概率 取决 于 城市 的 规模 。 在 一 个 5X5 的 小 城市 里 ， 很 确定 狗 能 够 逃脱 。 但 是 当 
城市 很 大 的 时 候 能 确保 有 机 会 逃脱 吗 ? 我 们 也 对 其 他 参数 感 兴趣 。 例 如 ， 狗 为 ”死胡同 
了 逃走 需要 移动 的 平均 距离 是 多 少 ? 这 只 狗 在 逃跑 过 程 中 走 到 某 个 特定 区 域 的 
概率 有 多 大 ? 这些 属性 在 刚刚 提 到 的 各 种 应 用 程序 中 很 重要 。 

SelfAvoidingWalk (程序 1.4.4 ) 模拟 了 这 种 情况 ， 它 使 用 了 一 个 二 维 布尔 
数组 ， 其 中 每 个 元 素 表 示 一 个 交叉 路 口 。 值 为 true 表示 狗 已 经 访问 了 该 交叉 
路 口 ; false 表示 狗 没 有 访问 交叉 路 口 。 路 径 从 中 心 开 始 ， 每 次 随机 选择 一 个 
步 又 ， 走 到 尚未 访问 的 地 方 ， 直 到 在 边界 处 成 功 逃 跑 或 者 被 卡 住 。 为 了 简单 起 
见 ， 代 码 的 编写 方式 是 ， 如 果 选 择 的 随机 步 又 将 会 跳 回 到 已 经 访问 过 的 地 点 ， 
则 不 会 采取 执行 这 个 步 又 的 行动 ， 而 是 重新 再 产生 一 个 随机 步骤 以 找到 一 个 新 
的 地 点 (在 代码 中 ， 在 这 种 情况 下 我 们 认为 是 走 到 了 死胡同 ， 并 终止 循环 )。 

请 注意 ， 该 代码 需要 依赖 于 Java 将 每 次 实验 的 所 有 数组 元 素 初始 化 为 false。 
它 还 展示 了 一 个 重要 的 编程 技术 ,我 们 在 while 语句 中 编写 循环 退出 测试 ， 以 防止 循环 体 中 出 现 
非法 语句 。 在 这 个 例子 中 ，while 循环 连续 条 件 可 以 用 于 防止 循环 内 出 界 数 组 的 访问 。 这 同时 
也 是 在 检查 狗 是 否 成 功 逃 脱 。 在 循环 内 部 ， 如 果 检 测 发 现 是 死胡同 则 会 通过 break 跳出 循环 。 





程序 1.4.4” 自 回避 的 随机 游 走 





public class SelfAvoidingWalk 
{ 


public static void main(String[] args) 了 
/bd deadEnds | 实验 陷入 死胡同 
L/ 在 一 个 nxXn 的 格子 中 走 i 区 
int n = Integer.parseIntCargs[0]); a[l[] 访问 过 的 交叉 路 口 
int trials = Integer.parseInt(args[1]); x,y 当前 位 置 


int deadEnds = 0; r 在 {0， 了 中 的 随机 数 
for (Cint t = 0; t < trials; t++) 


boolean[][] a = new boolean[n][n]; 
int x = Nn/2» Y= inX2; 
while (x>0 && x <n-1l&&y>0 &y < n-1) 
br a 然后 修 队 机 物 芭 
a[x][y] = tr 
if (a[x-1] [y] 0 a[x+1][y] && a[x][y-1] && a[x][y+1]) 
{ deadEnds++; break; } 
double r = Math random() ; 
if (Cr < 0.25) { if (!afx+1][y]) x++; 
else if (Cr < 0.50) { if (la[x-1][y]) x-=; 
else if (r < 0.75) { if (la[x] [y+1]) y++; 
else if (Cr < 1.00) { if (!a[x][y-1]) y=-; 
} 


} 
System.out.print1n(100*deadEnds/trials + "% dead ends"); 
} 


上 mm 





这 个 程序 需要 输入 两 个 命令 行 参数 n 各 trials， 然 后 在 nxn 的 格子 里 面 计算 trials 
次 自 回 避 的 随机 游 走 。 游 走 开始 的 位 置 在 格子 的 中 心 ， 每 走 一 步 ， 创 建 一 个 布尔 
数组 记录 走 过 的 位 置 ， 直 到 走 进 死 胡同 或 者 到 达 边 界 。 最 终 计算 的 结果 是 死胡同 
情况 占 的 百分比 。 增 加 实验 数量 可 以 提高 精确 度 。 


% java SelfAvoidingwalk 5 100 % java SelfAvoidingWalk 5 1000 
0% dead ends 0% dead ends 
% java SelfAvoidingWalk 20 100 % java SelfAvoidingwalk 20 1000 
36% dead ends 32% dead ends 
% java SelfAvoidingWalk 40 100 % java SelfAvoidingWwalk 40 1000 
80% dead ends 70% dead ends 
% java SelfAvoidingWalk 80 100 % java SelfAvoidingWalk 80 1000 
98% dead ends 95% dead ends 


70 觉 了 并 
































在 21x21 的 格子 里 面 的 自 回避 随机 游 走 


正如 你 在 上 文 的 例子 中 看 到 的 那样 ， 不 幸 的 是 ， 在 一 个 足够 大 的 城市 网 络 中 ， 你 的 狗 会 
存在 很 大 概率 陷入 死胡同 ， 如 果 你 对 自 回避 游 走 有 兴趣 ， 可 以 在 练习 中 找到 更 多 的 建议 。 例 
如 ， 在 三 维 空间 里 ， 狗 逃脱 的 概率 会 大 得 多 。 这 是 一 个 从 直观 上 很 容易 想到 的 结论 ， 我 们 的 
测试 也 可 以 证 明 这 个 结论 的 正确 性 ， 但 是 自 回避 游 走行 为 的 数学 模型 仍然 是 一 个 未 得 到 解决 
的 开放 问题 ; 尽管 进行 了 广泛 的 研究 ， 但 是 仍然 没有 一 个 数学 表达 式 能 够 用 来 描述 逃脱 的 概 
率 、 路 径 的 平均 长 度 或 任何 其 他 重要 的 参数 。 

总 结 ”数组 是 几乎 所 有 编程 语言 中 第 四 重要 的 基本 元 素 ( 排 在 赋值 语句 、 条 件 语句 、 循 
环 语句 之 后 )。 完 成 了 数组 的 学 习 ， 我 们 已 经 掌握 了 Java 语言 的 基本 结构 。 正 如 你 在 我 们 提 
供 的 示例 程序 中 看 到 的 那样 ， 你 可 以 使 用 这 些 结构 编写 程序 来 解决 几乎 所 有 的 问题 。 

在 我 们 学 习 过 的 许多 程序 中 ， 数 组 的 作用 是 很 突出 的 ， 通 过 使 用 数组 能 够 很 好 地 解决 许 
多 编程 任务 。 可 能 有 的 时 候 你 没有 显 式 地 使 用 数组 (其实 你 经 常 这 样 做 )， 而 是 在 “不 经 意 
间 ” 隐 式 地 使 用 了 数组 ， 因 为 所 有 计算 机 都 有 一 片 连续 的 内 存 ， 其 概念 上 等 同 于 数组 。 

数组 作为 一 个 基本 元 素 添加 到 程序 中 ， 给 我 们 带 来 的 最 大 变化 是 会 增加 程序 的 状态 数 
量 。 程 序 的 状态 可 以 定义 为 帮助 你 理解 程序 正在 做 什么 所 需要 的 信息 。 在 没有 数组 的 程序 
中 ， 如 果 你 知道 了 变量 的 值 以 及 下 一 条 要 被 执行 的 语句 ， 通 常 可 以 确定 程序 接 下 来 做 什么 。 
当 我 们 追踪 一 个 程序 的 执行 过 程 时 ,我 们 基本 上 就 是 在 追踪 它 的 状态 。 然 而 当 一 个 程序 使 用 
数组 时 ， 可 能 有 太 多 的 值 (每 一 个 值 都 可 能 被 每 一 个 语句 所 修改 )， 使 得 我 们 不 可 能 逐个 跟 
踪 它 们 。 这 种 差异 使 得 用 数组 编写 程序 比 不 使 用 数组 更 具有 挑战 。 

数组 能 直接 代表 向 量 和 矩阵， 因此 它们 能 直接 用 于 与 科学 和 工程 中 许多 基本 问题 相关 的 
运算 。 数 组 也 提供 了 一 种 存储 和 处 理 大 规模 数据 的 标准 方式 ， 所 以 它们 在 任何 涉及 处 理 大 数 


据 的 应 用 程序 中 扮演 着 重要 的 角色 ， 你 在 本 书 中 会 看 到 很 多 这 样 的 例子 。 
问答 环节 


问 : 一 些 Java 程序 员 使 用 int af[] 而 不 是 int[] a 来 声明 一 个 数组 。 两 者 有 何 区 别 ? 

答 : 在 Java 中 ， 两 者 都 是 合法 的 并 且 本 质 相 同 。 前 者 是 C 中 数组 的 声明 方式 ， 后 者 是 
Java 中 首选 的 方式 ， 因 为 变量 类 型 int[] 更 能 清楚 地 说 明 是 一 个 int 数组 。 

问 : 为 什么 数组 的 索引 是 从 0 开始 而 不 是 从 1? 

答 : 这 个 约定 起 源 于 计算 机 编程 语言 ， 其 中 数组 元 素 的 索引 是 通过 数组 的 起 始 地 址 加 上 
索引 来 计算 的 。 从 1 开始 索引 将 导致 数组 起 始 地 址 的 浪费 或 者 需要 额外 减 1 的 时 间 。 

问 : 如 果 我 用 一 个 负数 来 索引 数组 会 发 生 什么 ? 

答 : 结果 与 使 用 一 个 很 大 的 数 做 索引 一 样 。 只 要 你 尝试 的 索引 值 不 在 0 和 数组 长 度 所 规 
定 的 范围 内 ，Java 就 会 抛 出 一 个 ArrayIndexOutOfBoundsException 异常 。 

问 : 数组 初始 化 时 ， 为 每 一 项 设 定 的 值 是 否 必 须 是 文字 常量 ? 

答 : 不 必要 。 数 组 初始 值 中 的 条 目 可 以 是 任意 表达 式 〈 但 必须 与 指定 类 型 相 匹配 )， 即 
使 它们 的 值 在 编译 时 还 不 能 确定 下 来 。 例 如 下 面 的 代码 片段 使 用 命令 行 参数 theta 初始 化 一 
个 二 维 数组 : 


double theta = Double.parseDouble(args[0]); 
double[][] rotation = 


{ Math.cos(theta), -Math.sin(theta) }, 

T { Math.sin(theta), Math.cos(theta) }, 

问 : 字符 串 String 和 字符 数组 之 间 有 区 别 吗 ? 

答 : 有 。 例如， 你 可 以 更 改 char[] 数组 中 某 一 个 特定 的 字符 ,但 是 不 能 更 改 String 对 象 
中 的 字符 。 我 们 将 在 3.1 节 中 详细 探讨 字符 串 。 

问 : 当 使 用 (a==b) 比较 两 个 数组 时 会 发 生 什 么 ? 

答 : 当 且 仅 当 a[] 和 b[] 引用 相同 的 数组 (内存 地 址 ) 时 ， 表 达 式 的 计算 结果 为 真 值 ， 这 
并 不 是 用 来 判断 它们 存储 的 序列 值 是 否 相同 。 不 幸 的 是 ， 你 通常 并 不 是 想 比较 它们 引用 的 地 
址 。 因 此 ， 你 需要 用 for 循环 来 比较 对 应 的 元 素 是 否 相 同 来 判断 两 个 数组 是 否 相 同 。 

问 : 当 为 数组 变量 使 用 赋值 语句 时 ， 如 a=b， 会 发 生 什么 情况 ? 

答 : 赋值 语句 能 够 使 变量 a 和 b 引用 相同 的 数组 一 一 但 它 不 会 按照 你 的 预期 把 数组 b 中 
的 值 拷贝 到 数组 a 中 。 例 如 ， 考 虑 以 下 代码 片段 : 


a[0] < 9; 


当 使 用 了 赋值 语句 a=b 后 ， 元 素 a[0] 等 于 5， 元 素 a[1] 等 于 6， 以 此 类 推 。 也 就 是 说 两 
个 数组 对 应 相同 的 序列 。 然 而 它们 并 不 是 相互 独立 的 数组 。 例 如 ， 在 最 后 一 个 语句 执行 后 ， 
不 仅仅 是 a[0] 等 于 9，b[0] 也 等 于 9。 这 是 基本 类 型 (如 int 和 double) 和 非 基 本 类 型 (如 数 
组 ) 之 间 的 重要 区 别 ， 我 们 在 学 习 2.1 节 中 的 将 数组 传递 给 函数 和 3.1 中 的 引用 类 型 时 ， 将 
会 更 详细 地 回顾 这 个 微妙 的 (但 至 关 重 要 的 ) 区 别 。 


好 


营 工 间 


问 : 如 果 af[] 是 一 个 数组 ， 为 什么 System.out.println(a) 打印 的 是 类 似 @f62373， 而 不 是 


数组 中 的 值 呢 ? 
答 : 这 是 一 个 好 问题 ， 它 打印 的 是 数组 的 内 存 地 址 〈 以 十 六 进 制 显 示 )， 不 幸 的 是 ， 这 
很 少 是 你 想 要 的 。 


问 : 使 用 数组 时 应 该 注意 哪些 其 他 陷阱 ? 


答 : 记 住 创建 数组 时 Java 会 自动 初始 化 数组 是 非常 重要 的 ， 因 此 创建 数组 花 的 时 间 与 其 
长 度 成 正比 。 


练习 


1.4.1 


1.4.2 


1.4.3 


1.4.4 


1.4.8 


1.4.9 


编写 一 段 代 码 ， 声 明 、 创 建 和 初始 化 一 个 长 度 为 1000 的 数组 a[]， 然 后 访问 a[1000]。 你 的 程序 
能 编译 吗 ? 当 你 运行 时 会 发 生 什么 ? 
描述 并 解释 当 你 尝试 使 用 下 面 语句 编译 程序 时 会 发 生 什 么 情况 : 
int n = 1000; 
int[] a = new int[n*n*n*n]; 
假设 有 两 个 长 度 为 x， 使 用 一 维 数组 来 表示 的 向 量 ， 编 写 一 段 代 码 ， 计 算 它们 之 间 的 欧 氏 距离 
(向 量 中 对 应 元 素 的 差 的 平方 和 ， 再 求 其 平方 根 )。 
编写 一 段 代 码 ， 将 一 个 一 维 字符 数组 中 的 值 顺序 颠倒 过 来 ， 不 要 创建 额外 的 数组 来 保存 结果 。 
提示 : 使 用 书 中 的 代码 来 交换 两 个 元 素 的 值 。 
以 下 代码 片段 有 什么 错误 ? 
ineEl] as 
for (int i = 0; 1 < 10; i++) 
入 [让 让 二 下 
编写 一 个 代码 段 来 打印 二 维 布尔 数组 的 内 容 ， 用 “*” 来 表示 真 值 ， 用 空格 来 代表 假 值 。 需 要 
打印 出 行 号 和 列 号 。 
以 下 代码 段 会 打印 什么 ? 
int[] a = new int[10]; 
for (int i = 0; i < 10; i++) 
a[i] = 9 - i; 
for (int i = 0; i < 10; i++) 
a[i] = a[a[i]]; 


for (int i = 0; i < 10; i++) 
System.out.printin(a[i]); 


以 下 代码 会 在 数组 a[] 中 放 入 什么 值 ? 


int 7 = 10; 

int[] a = new int[n]; 

a[0] = 1; 

a[1l] = 1; 

for (int 1 = 2; i < n; i++) 
a[i] = a[i-1] + a[i-2]; 


以 下 代码 段 会 打印 什么 ? 
1 ROLER2Z 
int[] b= {1, 2; 
System.out.printin 


1.4.10 


1.4.11 


1.4.12 


1.4.13 


1.4.14 


1.4.15 
1.4.16 


1.4.17 


1.4.18 


1.4.19 
1.4.20 


1.4.21 
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编写 一 个 程序 Deal， 输 入 一 个 命令 行 参数 n， 实 现 从 一 把 洗 好 的 扑克 牌 中 抽出 n 手 牌 (每 一 手 
5 张 ) 并 显示 牌 面 的 值 ， 每 手 牌 之 间 用 空 行 分 隔 。 
编写 一 个 程序 HowMany， 该 程序 可 以 接受 任意 多 个 命令 行 参数 ， 并 且 打 印 出 用 户 输入 的 命令 
行 参 数 的 个 数 。 
编写 一 个 程序 DiscreteDistribution ， 该 程序 可 以 接受 任意 多 个 整数 型 命令 行 参数 ， 并 且 计 算 第 
i 个 命令 行 参数 与 i 成 比例 的 概率 。 
编写 一 段 代码 ， 创 建 一 个 二 维 数组 b[][]， 并 使 它 成 为 现存 二 维 数 组 a[][] 的 副本 ， 试 针对 下 面 
每 一 种 假设 的 情况 进行 处 理 : 
a.[][] 是 正方 形 b.[[ 是 矩形 c. [][] 可 能 是 不 规则 的 

b 的 解决 方案 应 该 适用 于 a， 而 c 的 解决 方案 应 该 适用 于 b 和 a， 并 且 你 的 代码 应 该 逐渐 
变 得 更 加 复杂 。 
编写 一 个 代码 片段 打印 一 个 正方 形 二 维 数组 的 转 置 (行列 交换 )。 例 如 ， 对 于 书 中 的 电子 表格 
数组 ， 你 的 代码 打印 以 下 内 容 : 


9 90° "Ie I SP IE TO "GE SE 0 

85H 257) "778 B20 MM 6 WINO0 Tht 

98> 78 767" 11 v22. S48 89 24 738 

编写 一 个 代码 片段 ， 在 不 需要 创建 第 二 个 数组 的 情况 下 转 置 一 个 正方 形 的 二 维 数组 。 

编写 一 个 程序 ,需要 输入 整数 型 命令 行 参 数 n， 并 创建 一 个 nXn 的 布尔 数组 a[][]， 使 得 如 果 
i 和 j 互 质 (没有 共同 因子 )，a[i][0j] 的 值 为 真 ， 否则 为 假 。 使 用 练习 1.4:6 的 方案 来 打印 数组 。 
提示 : 使 用 素数 得 法。 

修改 书 中 电子 表格 代码 片段 以 计算 行 的 加 权 平 均值 ， 其 中 每 个 考试 成 绩 的 权重 在 一 维 数组 
weights[] 中 。 例 如 ， 要 将 这 个 例子 中 三 次 考试 的 最 后 一 次 的 权重 分 配 为 前 两 次 考试 的 两 倍 ， 
你 可 以 使 用 : 

double[] weights = { 0.25, 0.25, 0.50 }; 


注意 权重 的 和 应 该 为 1。 

写 一 段 代码 ， 实 现 两 个 不 一 定 是 正方 形 的 天 形 矩 阵 的 乘法 。 注 意 : 为 了 更 好 地 定义 点 积 ， 第 一 
个 矩阵 中 列 的 数量 必须 等 于 第 二 个 矩阵 中 行 的 数量 。 如 果 不 能 满足 此 条 件 则 打印 一 条 错误 消息 。 
编写 一 个 程序 ， 处 理 两 个 布尔 方 阵 的 乘法 ， 使 用 or 操作 替代 “+”， 使 用 and 操作 替代 “* ”。 
修改 SelfAvoidingWalk (程序 1.4.4 )， 计 算 并 打印 路 径 的 平均 长 度 和 走 进 死胡同 的 概率 。 分 开 
计算 逃跑 路 径 的 平均 长 度 和 死胡同 路 径 的 平均 长 度 。 

修改 SelfAvoidingWalk 以 找到 陷入 死胡同 的 路 径 ， 并 找 出 能 够 包含 这 一 路 径 的 最 小 轴 对 称 矩 
形 , 计算 这 些 矩 形 的 平均 面积 。 


创新 练习 


1.4.22 


殿 子 模拟 。 下 面 的 代码 段 计 算 两 个 骨 子 总 和 的 确切 概率 分 布 : 


int[] frequencies = new int[13]; 
for (int i = 1; i <= 6; i4t) 
for (int j] ss 1; ] <=°6; j++) 
frequencies[i+j]++; 
double[] probabilities = new double[13]; 
for (int k = 1; k <= 12; k++) 
probabilities[k] = frequencies[k] / 36.0; 
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1.4.23 


1.4.24 


1.4.25 


1.4.26 


1.4.27 


1.4.28 


1.4.29 


1.4.30 


1.4.31 


党 了 站 


probabilities[k] 的 值 是 骨 子 和 为 k 的 概率 。 通 过 运行 试验 模拟 n 次 骨 子 投 拨 来 验证 此 结 
论 。 假 设 每 次 投掷 的 结果 均匀 地 分 布 在 1 一 6 之 间 的 整数 上 ,计算 这 样 的 两 个 变量 的 和 ， 跟 踪 
每 个 值 的 出 现 频 率 。n 需要 多 大 ， 才 能 使 你 的 实验 结果 与 上 面 给 出 的 标准 答案 相 匹 配 ?( 精 度 
到 小 数 点 后 三 位 时 能 够 匹配 即 认为 两 个 数字 是 匹配 的 。) 
最 长 平台 。 给 定 一 个 整数 数组 ， 找 到 最 长 平台 的 长 度 和 位 置 。 平 台 是 指 连续 的 等 值 序列 ， 并 
且 紧 接 在 该 序列 之 前 和 之 后 的 元 素 值 较 小 。 
经 验 混 洗 检 验 。 运 行 计算 实验 来 检查 我 们 的 混 洗 代码 是 否 如 我 们 预期 的 那样 完成 了 它 的 工作 。 
编写 一 个 程序 ShuffleTest， 它 需要 输入 两 个 整数 命令 行 参 数 m 和 n， 数 组 a[] 大 小 为 m， 对 数 
组 al] 进行 n 次 混 洗 ， 每 次 混 洗 前 数组 a[] 初始 化 为 afij=is 输出 mxm 的 表格 ， 其 中 第 i 行 存 
储 的 是 i 出 现在 位 置 j 的 次 数 。 对 于 随机 的 数据 ， 数 组 中 所 有 元 素 的 结果 都 应 趋 近 于 n/m。 
不 良 混 洗 。 假 设 我 们 在 混 洗 代码 中 使 用 范围 为 0 到 n-1 的 随机 数 代替 范围 1 到 n-1 之 间 的 随 
机 数 。 证 明 由 此 产生 的 序列 在 所 有 可 能 的 n! 种 结果 中 出 现 的 概率 不 是 均等 的 。 针 对 这 一 版 本 ， 
运行 上 一 题 的 测试 并 观察 结果 。 
音乐 随机 播放 。 将 你 的 音乐 播放 器 设置 为 随机 播放 模式 。 随 机 播放 n 首 歌曲 各 一 次 ， 然 后 重 
复 。 编 写 一 个 程序 来 估计 你 不 会 听 到 任何 连续 的 两 首 歌曲 的 可 能 性 (也 就 是 说 ， 歌 曲 3 不 跟随 
歌曲 2， 歌 曲 10 不 跟随 歌曲 9， 等 等 )。 
最 小 值 的 排列 。 编 写 一 个 采用 整数 命令 行 参数 n 的 程序 ， 生 成 一 个 随机 排列 ， 打 印 排列 ， 并 
打印 排列 中 的 从 左 到 右 的 最 小 值 的 数目 ( 即 到 目前 为 止 元 素 是 最 小 的 次 数 )。 然 后 编写 一 个 程 
序 ， 该 程序 需要 两 个 整数 命令 行 参数 m 和 n， 生 成 长 度 为 n 的 m 个 随机 排列 ， 并 在 生成 的 排 
列 中 打印 从 左 到 右 的 最 小 值 的 平均 数 。 额 外 鼓励 : 创建 一 个 函数 ， 函 数 参 数 为 nm， 返回 数组 大 
小 为 n 的 从 左 到 右 的 最 小 值 的 数量 。 
倒序 排列 。 编 写 一 个 程序 ， 从 nn 个 命令 行 参数 读 取 从 0 到 n-1 的 一 个 排列 ， 输 出 其 倒序 排列 
(如 果 排 列 是 一 个 数组 a[]， 则 其 倒序 排列 b[] 满足 a[b[i]]=b[a[i]]=i)。 请 确保 输入 参数 为 一 个 有 
效 的 排列 。 
哈达 玛 短 阵 。nXn 的 哈达 玛 矩 阵 Hl(n) 是 一 个 布尔 矩阵 ， 具 有 显著 的 性 质 ， 即 任意 两 行 在 n/2 
值 中 都 不 相同 (此 性 质 可 充分 用 于 设计 纠 错 码 )。AH(1) 是 一 个 1X1 的 矩阵 仅 有 一 个 值 为 真 的 
元 素 。 对 于 n>1 的 情况 ，H(2n) 在 一 个 大 的 正方 形 中 包含 了 四 个 对 齐 的 H(n) 的 副本 ， 然 后 颠 


倒 右 下 角 的 nXn 的 副本 ， 如 以 下 例子 所 示 (其 中 ,通常 情况 下 工 代表 真 值 ,，F 代表 假 值 )。 


H(1) HQ) H(4) 
T 人 tt TT TT 
TF TFTF 

TTFF 

TFFT 


编写 一 个 采用 整数 命令 行 参数 n 的 程序 并 打印 H(n)。 假 定 n 是 2 的 震 。 

谣言 。Alice 正在 与 其 他 nn 个 客人 (包括 Bob) 开 一 个 派对 。Bob 开始 先 制造 了 一 个 关于 Alice 
的 谣言 ， 并 告诉 其 中 一 个 客人 。 第 一 次 听 到 这 个 谣言 的 客人 会 立即 告诉 下 一 个 客人 ， 这 个 客 
人 是 从 除了 Alice 和 听 到 的 人 以 外 随机 挑选 出 来 的 。 如 果 一 个 人 (包括 Bob) 第 二 次 听 到 了 这 
个 谣言 ， 则 他 / 她 不 会 进一步 散播 这 个 谣言 。 请 编写 程序 以 估计 派对 上 的 每 个 人 (除了 Alice) 
都 听 到 这 个 谣言 的 概率 ， 同 时 估计 听 到 这 个 谣言 的 客人 的 数量 。 

素数 的 个 数 。 比 较 程 序 PrimeSieve 的 方法 和 我 们 在 1.3 节 最 后 阐述 的 break 语句 中 使 用 的 
方法 。 这 是 一 个 典型 的 时 空 折 中 的 例子 : PrimeSieve 速度 比较 快 ， 但 是 要 求 使 用 一 个 长 度 
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1.4.34 
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1.4.36 


1.4.37 


1.4.38 


1.4.39 


1.4.40 


1.4.41 


为 n 的 布尔 数组 ， 另 一 种 方法 仅仅 使 用 两 个 int 变量 ， 但 实际 上 速度 较 慢 。 估 计 在 与 “java 
PrimeSeive 1000000” 相 同时 间 内 ， 第 二 种 方法 可 以 找到 的 最 大 n 值 为 多 少 ? 

扫雷 游戏 。 编 写 一 个 程序 ， 采用 三 个 命令 行 参数 m、n 和 p， 并 生成 一 个 mxn 的 布尔 数组 ， 
各 元 素 的 占用 概率 是 p。 在 扫雷 游戏 中 ， 占 用 状态 单元 格 代表 地 雷 ， 空 单元 格 代 表 安 全 单元 
格 ， 输 出 数组 ， 使 用 星 号 表示 地 雷 ， 使 用 英文 句号 为 安全 格 。 然 后 ， 用 相 邻 炸 弹 的 数量 (上 、 
下 、 左 、 右 或 对 角 线 ) 创建 一 个 整数 二 维 数组 。 


重复 值 查找 。 给 定 一 个 长 度 为 n 的 整数 数组 ， 其 中 每 个 值 都 位 于 1 到 之 间 ， 编写 一 个 代码 
段 来 确定 是 和 否 有 重复 的 值 。 你 可 以 不 使 用 额外 的 数组 (但 你 不 必 保留 给 定数 组 的 内 容 )。 

自 回避 游 走 的 长 度 。 假 设 网 格 的 大 小 没有 限制 。 运 行 实验 估计 平均 路 径 长 度 。 

三 维 自 回 避 游 走 。 运 行 实验 以 验证 三 维 的 自 回 避 游 走 遇 到 死胡同 的 概率 为 0， 并 计算 n 个 不 同 
值 的 平均 路 径 长 度 。 

随机 步行 者 。 假 设 n 个 随机 步行 者 从 nXn 的 网 格 中 心 开始 ， 每 次 移动 一 步 ， 每 一 步 选 择 走 
上 、 下 、 左 、 右 的 概率 是 相同 的 。 编 写 一 个 程序 帮助 制定 和 测试 关于 所 有 单元 格 被 走 过 前 走 
过 的 总 步 数 的 假设 。 

桥牌 一 手 牌 统计 。 在 桥牌 游戏 中 ， 四 个 选手 各 有 一 手 13 张 扑 克 牌 。 其 中 一 个 重要 的 数据 统计 
是 每 手 牌 的 不 同 花 色 纸牌 的 数量 。 请 问 ，5-3-3-2、4-4-3-2 或 4-3-3-3 哪个 最 有 可 能 出 现 ? 
生日 问题 。 假 设 人 们 进入 一 个 空房 间 ， 直 到 有 一 对 人 的 生日 相同 为 止 。 平 均 进 入 多 少 人 才能 
使 得 两 个 人 生日 相同 ? 运行 实验 以 估计 此 数量 的 值 。 假 设 生日 在 0 到 364 之 间 均 匀 随 机 分 布 。 
卡 券 收集 问题 。 运 行 实 验 来 验证 经 典 的 数学 结果 ， 即 要 收集 个 不 同类 型 的 卡 券 需要 购买 卡 券 
数量 大 约 为 nH,， 其 路 , 是 第 个 谐 波 数 。 例 如 ， 如 果 和 仔细 观察 二 十 一 点 牌 桌 上 的 扑克 (假设 
庄家 洗 好 的 牌 数量 足够 多 )， 平 均 意 义 上 说 ， 你 需要 翻 开 大 约 235 张 牌 , 才 可 以 看 见 每 张 扑 克 牌 。 
铝 尾 式 洗 牌 。 编 写 一 个 程序 ， 使 用 铝 尾 式 洗 牌 法 的 Gilbert-Shannon-Reeds 模型 重新 排列 一 副 
n 张 的 扑克 有 牌 。 首 先 ， 根据 二 项 分 布 产 生 一 个 随机 整数 x+ (假设 把 一 枚 完全 对 称 的 硬币 随机 抛 
起 nn 次 ,其 中 正面 朝 上 的 次 数 为 r); 其 次 ， 把 一 副 牌 一 分 为 二 ,一 半 包 括 r 张 扑克 牌 ， 另 一 半 
包括 n-r 张 扑 克 牌 。 完 成 洗 牌 ,重复 下 列 步骤 : 从 两 堆 牌 中 ， 把 顶部 的 纸牌 放 在 一 堆 新 纸牌 
的 下 面 。 如 果 第 一 上 摊牌 剩 下 石 张 牌 ， 第 二 堆 剩 下 痛 长 牌 ， 则 从 第 一 堆 牌 选 取 一 张 牌 的 概率 为 
m(m+n2)， 从 第 二 堆 牌 选取 一 张 牌 的 概率 为 nz/(ma+nz)。 研 究 需要 多 少 次 铝 尾 式 洗 牌 ， 才 能 把 
52 张 牌 洗 成 一 副 均匀 混 洗 的 扑克 牌 。 

二 项 式 系数 。 编 写 一 个 程序 ， 它 需要 一 个 整数 命令 行 参数 n 并 创建 一 个 二 维 不 规则 数组 a [] 口 ， 
其 中 a[n][k] 包含 了 当 你 抛 出 一 个 硬币 n 次 时 恰好 是 k 面 的 概率 。 这 些 数据 称 为 二 项 分 布 : 如 
果 将 第 i 行 中 的 各 元 素 乘 以 2"， 得 到 (x+l)a 中 不 的 系数 的 结果 为 按 帕 斯 卡 三 角形 排列 的 二 项 
式 系数 。 计 算 方式 如 下 : 首先 ， 从 对 于 所 有 的 nm 和 afn][0]=0.0、af[1][H=L.0 开始 ; 然后 按 行 从 
左 到 右 依 次 计算 所 得 值 ， 计 算 公 式 为 : a[n][k]=(a[n-1][k]+a[n-1][k-1])/2.0。 结 果 示 意 如 表 所 示 。 


帕斯卡 三 角形 二 项 分 布 
1 1 
入 2 12 
让 下 1/4 1/2 1/4 
1331 1/8 3/8 3/8 1/8 
14641 1/16 1/4 3/8 1/4 1/16 
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1.5 输入 /输出 


在 本 节 之 前 ， 我 们 一 直 使 用 命令 行 参数 和 标准 输出 作为 我 们 的 Java 程序 与 外 部 交互 
的 接口 。 在 本 节 中 ， 我们 将 扩展 它们 ， 以 使 得 Java 程序 与 外 部 的 交互 更 加 方便 。 这 些 新 
的 接口 包括 标准 输入 ( standard input)、 标 准 绘 图 ( standard drawing) 和 标准 音频 ( standard 
audio)。 标 准 输入 可 以 用 于 处 理 任 意 数量 的 输入 数据 并 实现 与 程序 的 交互 ; 标准 绘图 可 以 编 
码 图 像 ; 标准 音频 可 以 编码 声音 ,使 输入 和 交互 不 再 局 限于 文本 信息 。 这 些 新 功能 其 实 非常 
易于 使 用 ， 并 将 带 你 进入 一 个 编程 的 新 境界 。 

LO 通常 指 输入 /输出 ( Input/Output 的 英文 首 字 母 )， 它 表达 的 意思 也 是 这 两 个 术语 的 
组 合 。IO 是 程序 与 外 部 世界 交流 的 机 制 。 计 算 机 操作 系统 控制 着 与 计算 机 连接 的 各 种 物理 
设备 ， 从 而 实现 与 外 界 的 交互 。 我 们 的 程序 会 使 用 一 些 IO 相关 的 库 函 数 方法 ， 这 些 方法 会 
调用 操作 系统 提供 的 接口 最 终 实 现 UO。 为 了 提高 编程 的 通用 性 和 便捷 性 ， 这 些 库 函 数 通常 
将 LO 操作 进行 标准 化 抽象 (无 论 操作 系统 的 实现 如 何 ， 这 些 接口 库 会 根据 这 些 差 异 给 出 不 
同 的 实现 ， 并 提供 一 致 的 库 函 数 接口 译 者 注 )。 

你 已 经 学 会 了 如 何 从 命令 行 接收 参数 ， 如 何在 终端 窗口 打印 字符 串 ; 本 节 将 带 你 学 习 更 
多 的 数据 处 理 和 数据 呈现 工具 。 我 们 将 要 学 习 的 这 些 工具 和 函数 与 前 面 学 过 的 System.onut. 
print() 和 System.out.println() 库 方 法 类 似 ， 这 些 函 数 实现 的 不 是 纯 数 学 功能 ， 而 是 实现 一 些 
对 输入 设备 或 输出 设备 的 控制 功能 。 我 们 会 通过 控制 这 些 设备 实现 程序 的 数据 输入 和 输出 。 

从 程序 的 角度 来 看 ， 标 准 IO 机 制 的 一 个 基本 特征 是 输入 或 输出 的 数据 量 没有 限制 。 你 
的 程序 可 以 无 限 地 消耗 输入 数据 或 者 产生 输出 数据 。 

标准 IO 机 制 的 另 一 个 用 处 是 将 程序 连接 到 计算 机 外 部 存储 中 的 文件 (file) 上 。 标 准 输 
入 、 标 准 输出 、 标 准 绘图 和 标准 音频 都 可 以 很 容易 地 连接 到 文件 上 ， 这 使 得 Java 程序 很 容 
易 从 文件 中 加 载 数据 ， 或 者 将 处 理 结果 保存 到 文件 中 ， 以 便 存 档 或 者 供 其 他 程序 使 用 。 

总 览 从 1.1 节 开始 ， 我 们 一 直 在 使 用 Java 编程 的 常规 模型 。 为 了 照应 上 下 文 ， 我 们 
首先 简要 回顾 一 下 这 种 模型 。 

Java 程序 总 是 从 命令 行 接收 输入 字符 串 ， 然 后 打印 字符 串 作 为 输出 。 一 般 情况 下 ,使 
用 命令 来 运行 的 应 用 程序 (也 就 是 你 用 javac 和 java 命令 编译 和 执行 的 那个 程序 ) 都 会 用 
到 命令 行 参数 (command-line argument) 和 标准 输出 ( standard output)。 我 们 使 用 终端 窗口 
(terminal window) 来 调用 此 应 用 程序 。 这 种 模型 已 被 证 明 是 一 种 方便 直接 地 与 我 们 的 程序 
和 数据 进行 交互 的 方式 。 

命令 行 参数 。 命 令 行 参 数 是 我 们 在 编程 过 程 中 获取 输入 信息 的 常用 方式 之 一 ， 是 Java 
编程 的 标准 组 成 部 分 。 任 何 类 的 main() 方法 都 会 有 一 个 String 数组 args[ ] 作为 参数 ， 该 数 
组 是 由 操作 系统 提供 给 Java 的 命令 行 参 数 序列 。 按 照 惯例 ，Java 和 操作 系统 都 将 参数 作为 
字符 串 进行 处 理 ， 所 以 如 果 我 们 打算 将 一 个 参数 用 作 一 个 数字 ,我们 使 用 Integer.parseInt() 
或 Double.parseDouble() 这 样 的 函数 将 它 从 String 类 型 转换 为 相应 类 型 。 

标准 输出 。 对 于 打印 输出 值 ， 我 们 一 直 使 用 的 是 系统 方法 System.out.printin() 和 
System.out.print()。Java 程序 对 这 些 方法 的 一 系列 调用 ， 最 终 会 生成 抽象 的 字符 流 ， 我 们 把 
这 个 字符 流 称 为 标准 输出 ( standard output)。 默 认 情 况 下 ， 操 作 系 统 将 标准 输出 连接 到 终端 
窗口 。 到 目前 为 止 ， 我 们 程序 中 的 所 有 输出 都 出 现在 终端 窗口 中 。 

RandomSeq 程序 (程序 1.5.1 ) 就 是 一 个 使 用 此 模型 的 程序 。 它 需要 输入 一 个 命令 行 参 
数 n， 并 产生 分 布 在 0 和 1 之 间 的 n 个 随机 数 。 
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程序 1.51 生成 一 个 随机 序列 







public class RandomSeq 





public static void main(String[] args) 
了 /打印 [0,1) 之 间 的 n 个 随机 实数 的 序列 






int n = Integer.parseInt(args[0]); 
for (int i = 0; i < ni i++) 
System.out.println(CMath.random()); 







} 






} 
















该 程序 使 用 的 还 是 到 目前 为 止 我 们 一 直 在 使 用 的 Java 编 程 常规 模型 。 它 需要 输入 
一 个 命令 行 参数 ns 并 打印 处 于 0.0 和 1.0 之 间 的 n 个 随机 数 。 从 程序 的 角度 来 看 ; 输出 
序列 的 长 度 没 有 限制 。 










% java RandomSeq 1000000 
0.2498362534343327 
0.5578468691774513 
0.5702167639727175 
0.32191774192688727 
0.6865902823177537 









现在 我 们 将 在 命令 行 参数 和 标准 输出 的 基础 上 扩充 三 个 新 的 机 制 来 解决 它们 的 局 限 性 ， 
并 为 我 们 提供 一 个 更 有 用 的 编程 模型 。 这 些 机 制 为 我 们 提供 了 一 个 全 新 的 视角 来 理解 Java 
程序 如 何 将 标准 输入 流 和 一 系列 命令 行 参数 作为 信息 来 源 ， 以 及 如 何 将 信息 转换 为 标准 输出 
流 、 标 准 图 形 流 和 标准 音频 流 。 

标准 输入 。 我 们 要 学 习 的 类 StdIn 是 一 个 基于 标准 输入 流 抽象 接口 的 扩展 库 。 就 像 你 可 
以 在 程序 中 随意 打印 一 个 值 到 标准 输出 一 样 ， 通 过 这 个 库 ， 你 可 以 在 程序 执行 期 间 从 标准 输 
入 流 中 随时 读 取 一 个 值 。 

标准 绘图 。 我 们 要 学 习 的 类 StdDraw 可 以 实现 在 程序 中 创建 图 形 。 例 如 ， 可 以 在 计算 
机 窗口 创建 包含 点 和 线 的 简单 图 形 ， 也 可 以 创建 包含 文本 、 颜 色 和 动画 等 的 复杂 图 形 。 

标准 音频 。 我 们 学 习 的 类 StdAudio 可 以 实现 在 程序 中 创建 音频 。 它 使 用 标准 格式 将 数 
字 序列 转换 为 音频 。 

在 使 用 命令 行 参数 和 标准 输出 的 过 程 中 ， 其 实 是 我 们 一 直 在 使 用 一 些 简单 的 Java 内 置 
功能 ，Java 还 有 一 些 更 加 抽象 的 内 置 工 具 ， 如 标准 输入 、 标 准 绘图 和 标准 音频 ， 但 因为 它们 
使 用 起 来 较为 复杂 ， 因 此 我 们 通过 StdIn、StdDraw 和 StdAudio 库 提供 了 一 些 更 简单 的 接口 。 
同时 ， 为 了 使 我 们 的 编程 模型 在 逻辑 上 更 加 完整 ， 我 们 还 引入 一 个 StdOut 库 。 要 使 用 这 些 
库 ， 你 必须 为 Java 提供 StdIn.java、StdOut.java、StdDraw.java 和 StdAudio.java 这 几 个 源 代 
码 文件 (有关 详细 信息 ， 请 参阅 本 节 末 尾 的 问答 环节 )。 

标准 输入 和 标准 输出 可 追溯 到 20 世纪 70 年 代 UNIX 操作 系统 的 开发 ， 并 且 在 所 有 现 
代 系 统 中 都 以 某 种 形式 被 实现 。 虽 然 它 们 比 起 那 时 开发 的 各 种 机 制 来 说 是 基础 的 ， 但 现代 
程序 员 仍然 依赖 它们 作为 将 数据 连接 到 程序 的 可 靠 方式 。 我 们 已 经 为 本 书 开发 了 与 早期 抽 
象 采用 相同 思想 的 标准 绘图 和 标准 音频 ， 以 提供 一 个 简单 的 方法 来 产生 视频 和 音频 输出 。 

标准 输出 ”Java 的 System.out.print() 和 System.out.println() 方法 已 经 可 以 实现 基本 标准 
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输出 ， 并 且 基 本 满足 我 们 编程 的 各 类 需求 。 但 是 ， 为 了 使 得 输入 和 输出 的 编程 模式 统一 ， 从 
本 节 开 始 及 后 面 章 节 ， 我 们 将 使 用 自 定 义 的 库 ey 命令 行 参数 
StdOut， 其 中 也 有 与 已 使 用 的 Java 方 法 类 似 的 函 
数 ， 如 StdOut.print() 和 StdOut.println() (有 关 不 同 
之 处 的 讨论 请 参阅 本 书 官网 )。 本 节 主 要 介绍 
StdOut.printf() 方法 ， 这 个 函数 值得 注意 的 一 点 是 ， 
它 可 以 更 好 地 控制 输出 的 形式 。 这 个 功能 最 早 在 
20 世纪 70 年 代 初 的 C 语言 中 引入 ， 到 目前 这 个 功 标准 音频 
能 仍然 出 现在 很 多 现代 语言 中 ， 足 见 其 非常 有 用 。 

自从 我 们 第 一 次 输出 double 类 型 的 值 时 ， 输 标准 图 形 
出 的 精度 问题 一 直 困 扰 着 我 们 。 例 如 ， 当 我 们 使 一 个 Java 程序 的 总 览 图 (回顾 ) 
用 System.out.print(Math.PTD 时 我 们 得 到 的 输出 是 3.141592653589793， 其 实 我 们 更 希望 得 

129| 到 的 是 3.14 或 者 3.14159。print() 和 println() 方法 能 够 打印 出 数字 的 前 15 个 小 数位 ， 但 是 
有 时 我 们 不 需要 那么 多 位 数 。printf() 方法 的 功能 则 更 加 灵活 。 例 如 ， 它 允许 我 们 指定 将 浮 
点 数 转换 为 字符 串 输出 时 的 小 数位 数 。 我 们 可 以 通过 StdOut.printf("%7.5f", Math.PI) 得 到 
3.14159， 在 Newton (程序 1.3.6 ) 中 我 们 可 以 用 。 


StdOut.printf("The square root of %.1f is %.6f", c, t); 


替换 System.out.print(t)， 得 到 如 下 输出 : 


The square root of 2.0 is 1.414214 


接 下 来 ,我 们 将 描述 这 些 语句 的 含义 和 操作 ,以 处 理 其 他 内 置 数 据 类 型 。 


public class StdOut 

























void print(String s) 将 s 打 印 到 标准 输出 
void printlnCString s) 打印 s 到 标准 输出 并 另 起 一 行 
Vor 在 标准 输出 中 另 起 一 行 
void printf(String format, ... ) 根据 格式 规范 将 参数 打 

印 到 标准 输出 


我 们 的 库 函 数 API 中 提供 的 用 于 标准 输出 的 静态 方法 


格式 化 打印 的 基础 知识 。printf() 的 最 简单 形式 只 有 两 个 参数 。 第 一 个 参数 叫 格式 化 字 
符 囊 (format string)。 它 包含 一 个 转换 规范 (conversion specification)， 描 述 如 何 将 第 二 个 参 
数 转换 为 输出 的 字符 串 。 转 换 规范 的 格式 为 %w.pc， 其 中 w 和 Pp 是 整数 ，c 是 一 个 字符 ， 这 
三 个 变量 的 具体 解释 如 下 : 

。w 是 字段 宽度 (field width)， 表 示 应 写 人 的 字符 数 。 如 果 要 写 人 的 字符 数 超过 (或 等 

于 ) 字段 宽度 ， 则 忽略 字段 宽度 ; 否则 ， 输 出 时 用 空格 在 左边 填充 。 负 字段 宽度 表示 
输出 应 该 用 空格 在 右边 填充 。 

。.p 是 精度 (precision)。 对 于 浮 点 数 ， 精 度 是 小 数 点 后 的 位 数 ; 对 于 字符 串 ， 它 是 应 

130 该 打印 的 字符 串 的 字符 数 。 精 度 对 整数 没有 意义 。 
。c 是 转换 码 (conversion code)。 我 们 最 常 使 用 的 转换 码 是 d (用 于 Java 整数 类 型 的 十 
进 制 值 )、f (用 于 浮 点 数 )、e (使 用 科学 计算 符号 的 浮 点 数 )、s (用 于 字符 串 ) 和 b (用 
于 布尔 值 )。 
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字段 宽度 和 精度 可 以 省 略 ， 但 每 个 转换 规范 都 必须 具有 转换 码 。 


使 用 printf() 最 重要 的 一 点 是 转换 码 和 相应 参数 的 类 格式 化 
型 必须 匹配 。 也 就 是 说 ，Java 必须 能 够 从 参数 当前 的 类 和 


| 
型 转换 为 转换 码 所 需 的 类 型 。 每 种 类 型 的 数据 都 可 以 转换 stdout.printfC"% 团 E35" ,Math.PI) 
为 String， 但 如 果 你 运行 StdOutiprintf ("%12d"，Math.PI) A | 和 
或 StdOut.printf("%4.2f"，512 )， 则 会 得 到 一 个 运行 时 错 精度 
误 IllegalFormatConversionException。 格式 化 打印 语句 解析 
格式 化 字符 串 。 除 了 转换 规范 之 外 ， 格 式 化 字符 串 还 可 以 包含 字符 。 转 换 规 范 由 参数 值 


(转换 为 指定 的 字符 串 ) 替换 ， 所 有 剩余 字符 均 直 接 传递 到 输出 。 例 如 下 面 的 代码 。 


StdOut.printf("PI is approximately %.2f.\n", Math.PI); 
将 会 打印 出 一 行 
PI is approximately 3.14. 


值得 注意 的 是 ， 我们 需要 在 格式 化 字符 串 中 明确 包含 换行 符 \n,- 以 实现 通过 printO 打 
印 新 行 。 

多 个 参数 。printf() 方法 也 可 以 使 用 两 个 以 上 的 参数 。 在 这 种 情况 下 ， 格 式 化 字符 串 将 
为 每 个 参数 提供 对 应 的 转换 规范 ， 转 换 规范 在 格式 化 字符 串 中 可 能 由 其 他 字符 分 隔 ， 以 便 在 
输出 时 能 够 有 所 区 分 。 例 如 ， 计 算 贷 款 所 支付 的 利息 ( 见 练习 1.5.13 )， 则 可 以 在 内 部 循环 
中 使 用 下 列 语 句 ， 用 于 打印 表格 中 第 二 行 和 后 续 行 : 


String formats = "%3s $%6.2f  $%7.2f  $%5.2f\n"; 
StdOut.printf(formats, month[i], pay, balance, interest); 


就 会 得 到 下 面 这 样 的 表格 : 


payment balance interest 
Jan $299.00 $9742.67 $41.67 
Feb $299.00 $9484.26 $40.59 
Mar $299.00 $9224.78 $39.52 


格式 化 打印 很 方便 ， 因 为 这 种 代码 比 我 们 用 来 创建 输出 字符 串 的 字符 串 连接 代码 要 简 
洁 。 我 们 只 描述 了 基本 选项 ， 更 多 信息 可 以 参阅 本 书 官网 。 





输出 的 转换 

类 型 代码 典型 值 格式 化 字符 串 样 例 后 字符 串 数值 
E "ol4d" 志 512" 
int d 512 "%-14d" "512 nr 
f "%14.2f" F595 ;和 7 

double 1595.1680010754388 "%.7f" "1595.1680011" 
"%14.4e" "” 1.5952e+03" 
"%14s" " Hello, World" 
String s "Hello, World” "%-14s" "Hello, World " 
"%-14.5s" "Hello 上 

boolean b true "%b" "true" 


printf() 的 格式 约定 (对 于 更 多 其 他 选项 ， 请 参见 本 书 官网 ) 


标准 输入 我们 的 StdIn 库 从 标准 给 入流 中 获取 数据 ， 该 数据 可 能 为 空 ， 也 可 能 包含 
以 空格 〈 多 空格 、 制 表 符 、 换 行 符 等 ) 分 隔 的 值 序列 ， 但 每 个 值 都 是 一 个 字符 串 或 者 是 一 
个 来 自 Java 某 个 基本 类 型 的 值 。 标 准 输入 流 的 重要 特点 之 一 是 : 程序 在 读 取 数据 时 会 消耗 
(consume) 输入 流 中 的 值 。 一 旦 程序 读 取 了 一 个 值 ， 它 将 无 法 备份 并 再 次 读 取 。 这 个 假设 是 
限制 性 的 ， 但 它 反 映 了 一 些 输入 设备 的 物理 特性 。 下 文 列 出 了 StdIn 的 API 方 法 。 这 些 方法 
大 体 上 可 以 分 成 四 类 : 


学 读 取 单 个 值 二 一 次 一 个 。 
到 读 取 行 这 至 次 去 行 3 

。 读 取 字 符 ， 二 次 一 个。 

。 读 取 相 同类 型 的 一 系列 值 。 


通常 来 说 ， 最 好 不 要 在 同一 程序 中 混合 使 用 不 同类 别 的 函数 。 以 下 亢 法 中 的 大 多 数 其 名 
称 即 描述 了 它们 的 功能 ， 但 其 精确 功能 还 需要 仔细 期 酌 。 


public class StdIn 


boolean isEmpty() 

int _ readInt() 

double readDouble() 
boolean readBoolean() 
String readString() 

从 标准 输入 读 取 字符 的 方法 
boolean hasNextChar() 
char readChar() 

从 标准 输入 读 取 行 的 方法 
boolean hasNextLine() 
String readLine() 

读 取 其 余 标准 输入 的 方法 
int[] readA11Ints() 
double[] readAllDoubles() 
boolean[] readAllBooleans() 
String[] readA11Strings() 
String[] readAllLines() 
String readA11() 


注 1: 数据 是 非 空 白字 符 的 最 大 序列 。 
注 2: 在 读 取 数据 之 前 ;任何 前 导 空 格 都 将 被 丢弃 。 


从 标准 输入 读 取 单 个 数据 的 方法 


标准 输入 是 否 为 空 (或 仅 有 空白 字符 ) ? 

读 取 一 个 数据 ， 将 其 转换 为 int 类 型 ， 然 后 返回 

读 取 一 个 数据 ， 将 其 转换 为 double 类 型 ， 然 后 返回 
读 取 一 个 数据 ,将 其 转换 为 boolean 类 型 ,然后 返回 
读 取 数据 并 将 其 作为 字符 串 返回 


标准 输入 中 是 否 还 有 字符 尚未 读 取 ? 
从 标准 输入 读 取 一 个 字符 并 返回 


标准 输入 中 是 否 有 下 一 行 尚未 读 取 ? 
读 取 行 的 其 余部 分 并 将 其 作为 字符 串 返 回 


读 取 所 有 剩余 的 数据 并 将 其 作为 int 数组 返回 

读 取 所 有 剩余 的 数据 并 将 其 作为 double 数组 返回 
读 取 所 有 剩余 的 数据 并 将 其 作为 boolean 数组 返回 
读 取 所 有 剩余 的 数据 并 将 其 作为 String 数组 返回 
读 取 所 有 剩余 的 行 并 将 其 作为 'String 数组 返回 

读 取 其 余 的 输入 并 将 它 作 为 一 个 字符 串 返回 


注 3: 有 类 似 的 方法 来 读 取 byte、short、long 和 float 类 型 的 值 。 


注 4: 读 取 输 入 的 每 个 方法 如 果 无 法 读 取 下 一 个 值 ， 


与 预期 类 型 不 匹配 。 


将 抛 出 运行 时 异常 ， 可 能 因为 没有 更 多 的 输入 或 因为 输入 


我 们 的 库 函 数 API 中 提供 的 用 于 标准 输入 的 静态 方法 


键入 输入 。 当 你 使 用 java 命令 从 命令 行 调用 Java 程序 时 ， 你 实际 上 在 做 三 件 事情 : 
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中 发 出 一 个 命令 来 开始 执行 程序 ，@) 指 定 命令 行 参数 ，@@ 开 始 定义 标准 输入 流 。 在 终端 窗口 
中 命令 行 之 后 键入 的 字符 串 即 标准 输入 流 。 程 序 等 待 你 在 终端 窗口 中 键入 字符 ， 当 你 键入 字 
符 时 ， 你 正在 与 你 的 程序 进行 交互 。 

例如 ， 我 们 想 要 设计 一 个 程序 AddInts， 它 首先 从 标准 输入 读 入 一 个 参数 mn， 然后 从 
标准 输入 读 取 mn 个 数字 ， 并 计算 累加 和 ， 然 后 将 所 得 的 值 作 为 标准 输出 。 当 键入 “java 
AddInts 4” 来 运行 程序 时 ， 程 序 会 接收 到 命令 行 参数 4， 然后 调用 方法 StdIn.readInt()， 并 
等 待 键 入 4 个 整数 。 假 设 你 想 要 输入 的 第 一 个 数字 是 144， 你 键入 1， 然 后 键 人 4， 再 键 和 人 
4， 但 是 在 这 之 后 程序 没有 任何 反应 ， 因 为 StdIn 不 知道 你 已 经 完成 了 整数 的 输入 。 你 需要 
输入 <Return> ( 回 车 键 一 一 译 者 注 ) 来 表示 整数 的 结尾 ， 当 按 下 回 车 键 后 ，StdIn.readInt() 
会 立即 返回 144， 你 的 程序 将 输入 累加 到 sum 中 ， 然 后 再 次 调用 StdIn.readInt()。 键 入 第 二 
个 值 之 前 ， 不 会 发 生 任 何事 情 : 如 果 键 入 2,， 键入 3; 键入 3》 然后 键入 <Return> 结束 输入 
数字 ，StdIn.readInt() 返回 233， 你 的 程序 再 次 将 输入 加 到 sum。 以 这 种 方式 键入 了 四 个 数字 
后 ，AddInts 不 再 需要 输入 ， 并 根据 需要 打印 总 和 。 


public class AddInts 


poe static void main(String[] args) ee 命令 行 参数 

int n = [Integer.parseIntCargs[0])|; tnt PA 
int sum = 0; 二 ] 
forCGint ec0 <) 解析 命令 行 参 数 144 
{ 233 i a 

int value = |StdIn. readIntO); 377 -一 标准 输入 流 

sum += Value; Se 

1024 


: 从 标准 输入 流 中 读 取 值 
StdOut.printin("Sum is ”+ Sum) ; Sum js 1778 
站 


标准 输出 流 


} 打印 到 标准 输出 流 
命令 解析 


输入 格式 。 当 StdIn.readInt() 期 望 得 到 一 个 int 类 型 时 ， 如 果 你 键入 abc 或 12.2 或 
true， 因 与 命令 所 需 的 字符 类 型 不 符 ， 它 将 返回 一 个 名 为 InputMismatchException 的 异常 。 
每 个 输入 的 格式 必须 与 你 在 Java 程序 中 指定 常量 时 使 用 的 格式 精确 匹配 。 为 方便 起 见 ， 
StdIn 将 连续 空格 字符 的 字符 串 视 为 一 个 空格 ， 并 允许 使 用 空格 符 对 数字 进行 分 隔 。 格 式 
上 ， 在 数字 之 间 放 置 多 个 空格 ， 或 者 在 同一 行 输入 数字 并 使 用 制 表 符 分 隔 它们 ， 再 或 者 将 
它们 分 散在 多 行 ， 都 是 允许 的 (除非 你 的 终端 应 用 程序 设计 为 一 次 处 理 一 行 标准 输入 ， 在 
这 种 情况 下 它 会 等 你 输入 <Return>， 然 后 将 该 行 上 的 所 有 数字 发 送 到 标准 输入 )。 你 可 以 在 
输入 流 中 混合 不 同类 型 的 值 ， 但 是 每 当 程 序 期 望 特定 类 型 的 值 时 ， 输 入 流 必须 具有 该 类 型 
的 值 。 

交互 式 用 户 输 入 。TwentyQuestions (程序 1.5.2 ) 是 一 个 与 用 户 进行 交互 的 简单 示例 
程序 。 该 程序 生成 随机 整数 ， 然 后 给 用 户 提 供 线 索 以 帮助 用 户 猜 测 到 该 数字 (通过 使 用 二 
分 搜索 ， 你 总 是 可 以 在 20 次 问答 内 得 到 答案 ， 参 见 4.2 节 )。 该 程序 与 我 们 编写 的 其 他 程 
序 之 间 的 根本 区 别 在 于 : 在 执行 程序 时 ， 用 户 可 以 更 改 控制 流程 。 这 一 特点 在 早期 的 计 
算 应 用 中 是 非常 重要 的 ， 但 是 我 们 现在 很 少 写 这 样 的 程序 ， 因 为 现代 应 用 程序 通常 会 通过 
图 形 用 户 界 面 进行 这 样 的 输入 ， 如 第 3 章 所 讨论 的 。 即 使 像 TwentyQuestions 这 样 的 简单 
程序 也 说 明了 编写 支持 用 户 交互 的 程序 可 能 非常 困难 ， 因 为 你 必须 计划 好 所 有 可 能 的 用 户 
输入 。 


四 ”得 Ls2 交互 式 用 户 输 入 





secret 


class TwentyQuestions 秘密 值 
| guess | 用 户 的 猜测 


public static void main(String[] args) 
f VV 当 半 户 尝试 猜测 数字 时 
// 生成 一 个 数字 并 回答 问题 
int secret = 1 + (int) (Math.random() * 1000000); 
StdOut.print("I'm thinking of a number "); 
StdOut.printlin("between 1 and 1,000,000"); 
int guess = 0; 
while (guess != secre 
{ ,WU 检测 -个 铺 测 值 并 提供 一 个 答案 
StdOut.print("What's your guess? "); 
guess = StdIn.readInt(); 
if (guess == secret) StdOut.printin("You win!"); 
if (guess < secret) StdOut.printin("Too low "); 
if (guess > secret) StdOut.printin("Too high"); 








这 个 程序 是 一 个 简单 的 猜 迷 游戏 。 每 当 你 输入 一 个 数字 ， 
程序 提出 问题 (是 这 个 数字 吧 ? 荐 和 
猜 对 时 ， 程 序 会 打印 “You win! ” (你 赢 了 ! ) 但 必须 在 20 个 人 
完 完成 。 要 使 用 此 程序 ， 必 须 名 stim 和 Sudow 在 休 的 Javaif 境 中 是 可 用 的 
(请 参阅 本 节 末 尾 的 第 一 个 问答 环节 征 


% java TwentyQuestions 
I’m thinking of a number between 1 and 1,000,000 
What’s your guess? 500000 
Too high 

What's your guess? 250000 
Too low 

What's your guess? 375000 
Too high 

What’s your guess? 312500 
Too high 

What's your guess? 300500 
Too low 


处 理 任意 大 小 的 输入 流 。 通 常 ， 输 入 流 是 有 限 的 : 你 的 程序 顺序 读 取 输入 流 ， 消 耗 输入 
流 中 的 数据 ， 当 流 为 空 时 终止 。 但 实际 上 输入 流 的 大 小 没有 任何 限制 ， 只 是 需要 程序 可 以 处 
理 提 交 给 它们 的 所 有 输入 。 程 序 Average (程序 1.5.3 ) 可 以 从 标准 输入 读 取 一 系列 浮 点 数 并 
打印 其 平均 值 。 该 程序 展示 了 输入 流 的 一 个 重要 特性 : 对 于 程序 来 说 ， 流 的 长 度 是 未 知 的 。 
我 们 输入 所 有 数字 ， 然 后 由 程序 计算 它们 的 均值 。 在 读 取 每 个 数字 之 前 ， 程 序 使 用 StdIn. 
isEmpty() 方法 来 检查 输入 流 中 是 否 还 有 数字 。 如 何 表示 我 们 不 再 输入 数据 ? 按照 惯例 ， 我 
们 在 结束 时 键入 一 个 特殊 的 字符 序列 ， 称 为 结尾 符 〈end-of-file )。 结 尾 符 对 于 终端 应 用 程序 
而 言 至 关 重 要 ， 不 幸 的 是 ， 现 代 操 作 系统 中 各 个 系统 对 结尾 符 都 有 各 自 的 定义 。 在 本 书 中 ， 
我 们 使 用 <Ctrl-D> 作为 结尾 符 (许多 系统 需要 <Ctrl-D> 独占 一 行 ) ; 还 有 一 种 广泛 使 用 的 约 
定 是 在 单独 的 一 行 中 键入 <Ctrl-Z>。Average 是 一 个 简单 的 程序 ， 但 它 展示 了 程序 的 一 个 重 
要 功能 : 通过 标准 输入 ， 我 们 可 以 编写 运行 程序 来 处 理 无 限量 的 数据 。 显 而 易 见 ， 此 类 程序 
在 数据 处 理应 用 中 非常 重要 。 

如 程序 TwentyQuestions 和 Average 所 示 ， 标 准 输入 是 我 们 使 用 的 命令 行 参 数 模型 的 必 
要 步骤， 原因 有 二 : 首先 ， 通 过 命令 行 参数 我 们 才 可 以 与 程序 交互 ， 在 程序 开始 执行 前 ， 我 
们 就 需要 向 程序 提供 数据 。 其 次 ， 通 过 命令 行 参 数 我 们 才 可 以 读 取 大 量 数 据 ， 而 且 只 能 是 符 
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合 命令 行 要 求 的 值 。 实 际 上 ， 正 如 程序 Average 所 示 ， 数 据 量 可 能 是 无 限 的 ,这 个 假设 使 得 
程序 变 得 简单 。 标 准 输入 的 第 三 个 要 点 是 操作 系统 可 以 改变 标准 输入 的 来 源 ， 所 以 你 不 必 从 
键盘 键入 所 有 的 输入 。 接 下 来 ,我 们 讨论 如 何 实现 这 一 功能 。 


程序 1.5.3” 求 数字 流 的 均值 







public class Average 所 读 的 数字 个 数 
public static void main(String[] args) ye 案 计 和 
{ // 求 标准 输入 的 均值 
double sum = 0.0; 
int n = 0; 
while (!StdIn.isEmpty()) 
{ // 从 标准 输入 中 读 取 一 个 数字 并 累计 总 和 
double value = StdIn.readDouble(); 
sum += Value; 
n++; 
} 
double average = sum / ni; 
StdOut .printin("Average is ”+ average); 
} 
} 


该 程序 从 标准 输入 读 取 一 系列 浮 点 数 ， 并 将 其 平均 值 打 印 到 标准 输出 
土 (前 提 是 总 和 没有 溢出 ) 。 从 它 的 角度 来 看 ， 输 入 流 的 大 小 没有 限制 。 
下 面 的 命令 使 用 重 定向 和 管道 ( 在 下 一 小 节 中 讨论 ) ， 提 供 100 000 个 数字 


% java Average % java RandomSeq 100000 > data.txt 
10.0 5.0 6.0 % java Average < data.txt 

3.0 Average is 0.5010473676174824 

7.0 32.0 % java Randomseq 100000 | java Average 


<Ctr]-D> Average is 0.5000499417963857 
Average is 10.5 


重 定向 和 管道 ”对 于 许多 应 用 ， 因 为 受到 我 们 键入 的 数据 量 (以 及 键入 速度 ) 的 限制 ， 
程序 的 处 理 能 力 被 低估 ， 从 而 使 标准 输入 流 往往 会 被 忽视 。 类 似 地 ， 我 们 经 常 希望 保存 打印 
在 标准 输出 流 上 的 信息 以 供 后 续 使 用 。 为 突破 这 些 限制 ， 我 们 必须 牢记 : 标准 输入 是 一 个 抽 
象 的 概念 一 一 程序 期 望 从 输入 流 读 取 数 据 ， 但 它 不 依赖 于 该 输入 流 的 来 源 。 标 准 输出 亦 是 如 
此 。 其 抽象 程度 取决 于 我 们 (通过 操作 系统 ) 为 标准 输入 和 标准 输出 指定 各 种 其 他 来 源 的 能 
力 ， 如 文件 、 网 络 程序 。 所 有 现代 操作 系统 都 实现 了 这 种 重新 定义 数据 来 源 的 机 制 。 

将 标准 输出 重 定向 到 文件 。 通 过 在 调用 程序 的 命令 中 添加 一 个 简单 的 指令 ,我 们 可 以 将 
其 标准 输出 流 重 定向 到 文件 中 存储 下 来 或 稍 后 输入 男 一 个 程序 。 例 如 ， 


% java RandomSeq 1000 > data.txt 


该 行 命令 表示 不 要 将 标准 输出 流 打印 在 终端 窗口 中 ， 而 是 写 人 名 为 data:txt 的 文本 文件 中 。 
每 次 调用 System.out.print() 或 System.out.printlin() 都 会 在 该 
文件 末尾 附加 文本 。 在 这 个 例子 中 ， 最 终 的 结果 是 包含 
1000 个 随机 值 的 文件 ， 而 终端 窗口 中 不 显示 任何 输出 : 它 | 9 
被 直接 输出 到 符号 “>” 后 指定 的 那个 文件 中 。 这 样 ， 我 们 
可 以 保存 信息 以 供 日 后 检索 。 请 注意 ， 为 实现 以 上 功能 ,我 

们 不 必 以 任何 方式 更 改 RandomSeq (程序 1.5.1 ) 一 一 这 也 将 标准 输出 重 定向 到 一 个 文件 


% java RandomSeq 1000 > data.txt 


84 党 工 章 


体现 了 标准 输出 的 抽象 性 ， 也 就 是 说 ， 我 们 对 这 些 抽 象 的 接口 给 出 不 同形 式 的 实现 ， 并 不 影 
响 抽 象 接口 的 使 用 。 使 用 重 定向 可 以 保存 任 一 程序 输出 。 如 果 你 花费 了 大 量 的 努力 来 获得 程 
序 运行 结果 ， 则 通常 需要 保存 结果 以 供 目 后 参考 。 在 现代 系统 中 ， 你 可 以 使 用 剪 切 和 粘贴 或 
操作 系统 提供 的 类 似 机 制 来 保存 一 些 信息 ， 但 剪 切 和 粘贴 对 于 大 量 数据 是 不 方便 的 。 相 比 之 


下 ， 重 定向 是 为 处 理 大 量 数据 而 专门 设计 的 。 


程序 1.5.4” 一 个 简单 的 过 滤器 








public class RangeFilter 


public static void main(String[] args) 
{ // 过 滤 不 在 1o0 和 hi 之 间 的 数字 
int lo = Integer.parseInt(args[0]); 
int hi = Integer.parseInt(args[1]); 
while (!StdIn.isEmpty()) 1o 范围 的 下 限 
{ AU 处 理 一 个 数字 hi 范围 的 上 限 
int value = StdIn.readInt(); De 当前 数字 
if (value >= lo && value <= hi) 
StdOut.print(value + " "); 


和 
Std0ut.println0) ; 





这 个 过 滤器 将 命令 行 参数 指定 范围 内 的 输入 流 中 的 数字 复制 到 输出 流 
中 ， 流 的 长 度 没有 限制 


% java RangeFilter 100 400 

358 1330 55 165 689 1014 3066 387 575 843 203 48 292 877 65 998 
358 165 387 203 292 

<Ctr1-D> 





将 文件 重 定向 到 标准 输入 。 同样 ,我 们 可 以 重 定向 标准 输入 流 ， 使 StdIn 从 文件 读 取 数 
据 而 不 是 从 终端 窗口 读 取 


% java Average < data.txt 


该 命令 从 文件 data.txt 读 取 一 系列 数字 ， 并 计算 它们 的 平均 值 。 具 体 来 说 ,“<” 符 号 是 
指示 操作 系统 通过 从 文本 文件 data.txt 中 读 取 数据 来 实现 标准 输入 流 ， 而 不 是 等 待 用 户 在 终 
端 窗口 中 输入 内 容 。 当 程序 调用 StdIn.readDouble() 时 ， 操 作 系 统 从 文件 中 读 取 值 。 文 件 
data.txt 可 能 由 任何 应 用 程序 创建 ， 而 不 仅仅 是 Java 程序 一 一 % java Average < data.txt 
你 的 计算 机 上 的 许多 应 用 程序 都 可 以 创建 文本 文件 。 从 文件 。 data.txt 
重 定向 到 标准 输入 的 能 力 使 我 们 能 够 创建 数据 驱动 的 代码 | | 
( data-driven code)， 你 可 以 更 改 程序 处 理 的 数据 ， 而 无 须 更 改 
程序 。 同 时 ， 你 可 以 在 文件 中 保存 数据 并 编写 一 个 从 标准 输 将 文件 重 定向 到 标准 输入 
入 流 读 取 的 程序 。 

连接 两 个 程序 。 实 现 标 准 输入 和 标准 输出 最 灵活 的 方式 是 由 我 们 自己 的 程序 实现 它们 。 
这 种 机 制 称 为 管道 (piping)。 例 如 ， 命 令 


% java RandomSeq 1000 | java Average 


规定 了 RandomSeq 的 标准 输出 流 和 Average 的 标准 输入 流 是 相同 的 流 。 它 的 效果 是 在 
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Average 运行 时 ，RandomSeq 会 将 其 生成 的 数字 输入 到 终端 窗口 。 该 示例 也 具有 与 以 下 命令 
相同 的 效果 : 


% java RandomSeq 1000 > data.txt 
% java Average < data.txt 


只 是 在 这 种 情况 下 不 必 创 建 data.txt。 这 种 区 别 有 非 常 重要 的 意义 ， 因 为 它 消除 了 我 们 可 
以 处 理 的 输入 输出 流 大 小 的 男 一 个 限制 。 例 如 ， 即 使 你 的 计算 机 上 可 能 没有 空间 保存 十 亿 个 数 
字 (但 是 ， 你 需要 时 间 来 处 理 它们 )， 你 也 可 以 在 示例 中 将 1000 替换 为 1000000000。 当 
RandomSeq 调用 System.out.println() 时 ， 添 加 一 个 字符 串 到 流 的 末尾 ; 当 Average 调用 StdIn. 
readInt() 时 ， 从 流 的 开始 处 删除 一 个 字符 串 。 具 体 先 
调用 哪个 取决 于 操作 系统 : 它 可 能 会 运行 RandomSeq， 
直到 它 产生 一 些 输出 ， 然 后 运行 Average 来 消耗 该 
输出 ， 或 者 它 可 能 运行 Average 直到 需要 一 些 输入 ， 
然后 运行 RandomSeq， 直 到 它 产 生 所 需 的 输入 。 最 
终 的 结果 是 一 样 的 ， 但 是 你 的 程序 不 必 担 心 这 些 细 将 一 个 程序 的 输出 输送 到 另 一 个 程序 的 输入 
节 ， 它 们 仅 与 标准 输入 和 标准 输出 抽象 一 起 工作 。 

过 滤器 。 管 道 是 20 世纪 70 年 代 初 UNIX 系统 的 核心 特性 功能 之 一 ， 并 仍 保留 在 现代 
系统 中 ， 因 为 它 能 够 将 不 同 程序 之 间 进 行 的 通信 简单 化 。 例 如 ， 许 多 UNIX 程序 现在 仍 在 使 
用 ， 并 且 要 处 理 比 程序 作者 当初 设想 的 要 大 成 千 上 万 倍 的 文件 。 通 过 标准 输入 和 标准 输出 ， 
我 们 可 以 用 方法 调用 其 他 Java 程序 ， 也 可 以 调用 之 前 编写 的 程序 ， 或 者 是 用 另 一 种 语言 编 
写 的 程序 。 通 过 标准 输入 和 标准 输出 ， 我 们 与 外 部 世界 建立 了 一 个 简单 的 接口 。 

常见 的 例子 程序 之 一 就 是 过 滤器 : 其 将 一 个 标准 输入 流 以 某 种 方式 转换 为 标准 输出 流 ， 
以 管道 作为 纽带 将 程序 连接 在 一 起 。 例 如 ，RangeFilter (程序 1.5.4 ) 需要 两 个 命令 行 参数 ， 
并 在 标准 输出 上 打印 来 自 标准 输入 指定 范围 的 数字 。 你 可 以 将 标准 输入 设想 为 来 自 某 些 仪器 
的 测量 数据 ， 并 使 用 过 滤器 将 实验 不 感 兴趣 的 数据 丢弃 。 

早期 为 UNIX 设计 的 几 个 标准 过 滤器 现在 仍 在 使 用 (其 中 有 一 些 更 换 了 名 称 )， 有 些 其 
至 已 经 成 为 现代 操作 系统 中 的 命令 。 例 如 ， 过 滤器 sort 能 够 将 标准 输入 上 传 来 的 数据 按照 从 
小 到 大 的 顺序 放 到 标准 输出 上 。 


% java RandomSeq 6,| sort 
0.035813305516568916 
0.14306638757584322 
0.348292877655532103 
0.5761644592016527 
0.7234592733392126 
0.9795908813988247 


我 们 将 在 4.2 节 讨 论 排序 。 第 二 个 有 用 的 过 滤器 是 grep， 它 从 标准 输入 打印 匹配 给 定 模 
式 的 行 。 例 如 ， 如 果 你 键入 : 


% java RandomSeq 1000 | java Average 


RandomSeq 










标准 输入 





% grep lo < RangeFilter.java 


会 得 到 如 下 结果 : 
/1/ 过 滤 不 在 1o 和 hi 之 间 的 数字 


int 1o = Integer.parseInt(args[0]); 
if (value >= lo && value <= hi) 


程序 员 经 常 使 用 诸如 grep 等 工具 来 快速 找到 变量 名 或 语言 的 使 用 细节 信息 。 第 三 个 有 
用 的 过 滤器 是 more， 它 从 标准 输入 读 取 数 据 ， 并 将 其 显示 在 终端 窗口 中 ， 每 次 显示 整个 屏 
幕 。 例 如 ， 如 果 你 输入 


% java RandomSeq 1000 | more 


你 将 在 终端 窗口 中 看 到 满 屏 数 字 ， 但 是 会 有 更 多 的 数字 等 待 你 点 击 空格 键 后 显示 在 下 一 屏 
中 。 术 语 过 滤器 (filter) 可 能 会 有 一 些 误导 : 它 的 原意 是 描述 像 RangeFilter 这 样 的 程序 ， 
RangeFilter 将 标准 输入 的 一 些 子 序列 写 和 标准 输出 ,但 是 现在 过 滤器 常用 于 描述 从 标准 输入 
读 取 并 写 入 标准 输出 的 程序 。 

多 个 流 。 对 于 许多 常见 程序 任务 ,我们 希望 能 够 从 多 个 来 源 获 取 输 入 ,或 者 为 多 个 目标 
产生 输出 。 在 3.1 节 中 ， 我 们 讨论 了 Out 库 和 隔 库 ,它们 扩展 了 StdOut 和 StdIn 以 允许 多 
个 输入 输出 流 ; 这 些 库 所 重 定向 的 数据 流 不 仅 可 以 来 自 文件 ， 还 能 来 自 网 页 。 

处 理 大 量 信 息 在 许多 计算 应 用 中 起 着 至 关 重要 的 作用 。 科 学 家 可 能 需要 分 析 从 一 系列 实 
验 中 收集 的 数据 ， 股 票 交 易 者 可 能 希望 分 析 关 于 最 近 金 融 交易 的 信息 ， 学 生 可 能 希望 保存 他 
们 收藏 的 音乐 和 电影 。 在 这 些 以 及 很 多 其 他 应 用 中 ， 数 据 驱 动 程序 成 为 规范 ， 而 通过 使 用 标 
准 输出 、 标 准 输入 、 重 定向 和 管道 ， 我 们 可 以 在 Java 程序 中 实现 这 些 应 用 和 功能 。 我 们 可 
以 通过 网 络 或 任何 标准 设备 将 数据 收集 到 计算 机 的 文件 中 ， 并 使 用 重 定向 和 管道 将 数据 连接 

143| ”到 我 们 的 程序 。 本 书 中 的 许多 编程 示例 都 具有 这 种 能 力 。 

标准 绘图 到 目前 为 止 ， 我 们 的 输入 /输出 仅 专注 于 文本 字符 串 。 现 在 我 们 介绍 如 何 生 
成 图 像 来 作为 输出 。 这 个 库 很 容易 使 用 ， 并 且 人 允许 我 们 利用 视觉 媒介 来 传递 信息 ， 这 通常 比 
文本 具有 更 强大 的 表现 力 。 

就 像 StdIn 和 StdOut， 我 们 的 标准 绘图 在 库 StdDraw 中 实现 ,你 需要 将 相应 的 文件 配置 
在 Java 环境 中 (请 参阅 本 节 结 尾 的 第 一 个 问答 环节 )。 标 准 绘图 非常 简单 。 我 们 设计 出 一 个 
抽象 的 绘图 设备 ， 能 够 在 二 维 画 布 上 绘制 线 和 点 ， 该 设备 能 够 通过 StdDraw 中 的 方法 调用 形 
式 发 出 命令 ， 如 下 所 示 : 


public class StdDraw (基础 绘图 命令 ) 
void line(double x0, double y0, double xl1，double y1) 
void point(double x, double y) 


与 标准 输入 和 标准 输出 的 方法 一 样 ， 这 些 方法 的 名 称 基 本 上 可 以 表示 它 的 功能 。 例 如 : 
StdDraw.line() 用 于 绘制 一 条 将 点 (x0,yo) 与 点 (x1,y1) 连接 起 来 的 直线 段 ， 华 标 由 参数 给 出 ; 
StdDraw.point() 以 参数 给 出 的 坐标 (x，y) 为 中 心 绘制 一 个 
点 ， 其 大 小 为 默认 的 单位 刻度 (所 有 x 坐标 和 y 坐标 位 于 0 
和 1 之 间 )。StdDraw 以 计算 机 屏幕 的 窗口 为 画布 ， 背景 为 
白色 ， 线 和 点 为 黑色 。 该 窗口 有 一 个 菜单 选项 ， 可 以 将 绘 
图 保存 到 文件 中 ， 并 可 以 打印 在 纸 上 或 发 布 到 网 上 。 

你 的 第 一 幅 画 。 类 似 于 编写 程序 的 第 一 步 是 从 Hello- 
World 开始 ， 使 用 StDraw 编程 图 形 的 第 一 步 是 Triangle， 
即 绘制 一 个 内 部 包含 一 个 点 的 等 边 三 角形 。 为 了 构成 三 角 ,» 
形 ， 我 们 绘制 三 条 线段 : 一 条 从 左下 角 的 点 (0,0) 到 点 (00) 

(1.0)， 一 条 内 点 (1.0) 到 点 (去 个 ) 还 有 一条 内 点 (二 ，StdDraw Tinec0，y0， x1, yD; 





(1,1) 





号 )】 到 (0.0)。 最 后 一 步 ， 我们 在 三 角形 中 间 面 一 个 点 。 一 旦 你 成 功 编译 并 运行 了 Triangle， 


你 就 可 以 编写 自己 的 程序 来 绘制 由 线段 和 点 组 成 的 图 形 。 这 项 能 力 会 使 你 的 输出 更 加 丰富 。 
当 你 使 用 计算 机 创建 图 像 时 ， 你 会 立即 获得 反馈 (图像 )， 以 便 快 速 改 进 你 的 程序 。 通 

过 计算 机 程序 ， 你 可 以 创建 依靠 手工 制作 无 法 完成 的 图 dy class Triangle 

像 。 特 别 是 我 们 可 以 使 用 更 加 具有 表现 力 的 图 片 来 展示 数 PU AR US Pr Ee TUE OT 

据 ， 而 不 是 仅仅 将 数据 视 为 数字 。 在 讨论 其 他 绘图 命令 之 double t = Math.sqrt(3.0)72.0; 


StdDraw.1line(0.0, 0.0, 1.0, 0.0); 


后 ， 我 们 将 研究 其 他 图 形 示例 。 0 
控制 命令 。 默认 画布 的 尺寸 是 a 像素 ; 如 果 要 StdDraw.point(0.5, t/3.0); 
更 改 它 ， 请 在 使 用 任何 绘图 命令 之 前 调用 setCanvasSize()。 
标准 绘图 的 默认 坐标 系 是 单位 正方 形 ， 但 我 们 经 常 想 绘 
制 不 同 尺度 的 图 像 。 例 如 ， 常 见 的 情况 是 我 们 希望 把 x 坐 
标 或 者 坐标 设 定 在 某 些 范围 内 ， 有 时 可 能 需要 同时 设 定 
x 坐标 和 yy 坐标 的 范围 。 此 外 ， 我 们 经 常 想 要 依据 标准 绘 
制 不 同 粗 细 的 线段 和 不 同 尺 寸 的 点 。 为 了 满足 这 些 需 求 ， 一 
StdDraw 具有 以 下 方法 : 你 的 第 一 幅 画 





public class StdDraw (基础 控制 命令 ) 





在 屏幕 二 创建 一 个 宽 为 w 和 高 
为 h (以 像素 为 单位 ) 的 画布 
void setXscale(double x0，double x1) 将 x-scale 重 置 为 (x0，xl) 
void setYscale(double y0，double y1) 将 y-scale 重 置 为 (y0, yl ) 
void setPenRadius(double radius) 将 画笔 的 半径 设置 为 radius 


注意 ; 具有 相同 名 称 但 无 参数 的 方法 重 置 为 默认 值 ，x-scale 和 y-scale 的 默认 值 是 单位 
平方 ， 画 笔 半 径 的 默认 值 是 0.002 


void setCanvasSize(int w, int h) 





例如 ， 两 个 调用 序列 : 


StdDraw.setXscale(x0, x1); 
StdDraw.setYscale(y0, y1); 


将 绘图 坐标 设置 在 左下 角 位 于 (xo,yo) 并 且 右上 角 位 于 (xi,y1) 的 边界 框 (bounding box) 内 。 
缩放 是 图 形 中 常用 的 简单 变换 。 在 本 章 的 应 用 中 ,我们 直接 使 int n = 50; . 
用 它 来 将 图 形 与 数据 相 匹配 。 er spe 

笔 是 贺 形 的 ， 所 以 线 有 圆 形 的 端点 ， 当 你 将 笔 的 半径 设 for Gn Toid sm 1 
为 > 并 绘制 一 个 点 时 ， 会 得 到 半径 为 > 的 圆 。 默 认 笔 半径 为 攻克 
0.002， 不 受 坐 标 缩放 的 影响 。 这 个 默认 值 约 为 默认 窗口 宽度 的 
1/500， 因 此 如 果 沿 水 平 或 垂直 线 绘制 等 间距 的 200 个 点 ， 你 将 
可 以 看 到 各 个 独立 的 圆圈 ， 但 是 如 果 绘 制 250 个 这 样 的 点 ,看 
起 来 则 是 像 一 条 线 。 当 使 用 StdDraw.setPenRadius (0.01 ) 命 
令 时 ， 表 示 线 段 的 厚度 和 点 的 大 小 是 0.002 标准 的 5 倍 。 

将 数据 过 滤 到 标准 绘图 。 标 准 绘图 最 简单 的 应 用 之 一 是 将 
标准 输入 过 滤 到 标准 绘图 来 绘制 数据 图 。PlotFilter (程序 1.5.5 ) 2 
是 一 个 过 滤器 : 它 从 标准 输入 读 取 由 (x,，y) 坐标 定义 的 一 系 ”缩放 到 整数 坐标 





列 点 ， 并 在 每 个 坐标 处 绘制 一 个 点 。 按 照 约定 ， 标 准 输入 上 的 前 四 个 数字 用 于 指定 边界 框 ， 
以 便 它 缩 放 图 形 ， 而 不 必 再 通过 所 有 点 来 确定 比例 。 以 这 种 方式 绘制 的 点 的 图 形 表示 比 数 
字 本 身 更 具 表现 力 〈 而 且 更 简洁 )。 相 比 一 个 坐标 列表 ， 通 过 程序 1.5.5 生成 的 图 像 更 容易 推 
断 点 的 属性 〈 例 如 ， 当 用 绘制 的 点 来 表示 城市 位 置 时 ， 很 容易 推断 出 人 口中 心 的 分 布 趋势 ) 。 
每 当 我 们 处 理 代 表 物 理 世 界 的 数据 时 ， 可 视 化 的 图 像 很 可 能 是 我 们 用 来 显示 输出 的 最 有 意义 


的 方法 之 一 。PlotFilter 程序 展示 了 如 何 轻松 地 创建 这 样 的 图 像 。 





程序 1.5.5 ”标准 输入 到 绘图 过 滤器 





public class PlotFilter 
{ 
public static void main(String[] args) yO% 下 边界 
{ x1 | 右边 界 
WN 按照 前 四 个 值 进行 缩放 yk 上 边界 上 


double x0 = StdIn,readDoubleGO); x, 下 当前 点 
double y0 = StdIn.readDoubleQO; em 
double xl = StdIn.readDoubleQO); ， 
double yl = StdIn.readDoubleQO; 

StdDraw.setXscale(x0, x1); 
StdDraw.setYscale(y0, yl1); 

WN 恋 取 点 坐标 并 使 用 标准 绘图 画 出 点 
while (!StdIn.isEmpty()) 
{ 


double x = StdIn.readDouble(); 
double y = StdIn.readDouble();- 
StdDraw.point(x, y); 
} 
过 
} 








该 程序 从 标准 输入 读 取 一 系列 点 ， 并 将 其 绘制 到 标准 绘图 (根据 惯例 ， 
前 四 个 数字 是 最 小 的 +、y 坐 标 和 最 大 的 x、y 华 标 ) 。 文 件 USA.txt 包 含 美国 
13 509 个 城市 的 坐标 。 


% java PlotFilter < USA.txt 





绘制 函数 图 。 标 准 绘图 的 另 一 个 重要 用 途 是 绘制 实验 数据 或 数学 函数 的 图 像 。 例 如 ， 假 
设 我 们 要 在 区 间 [0，m] 上 绘制 函数 y=sin(4x)+sin(20x) 的 图 像 。 这 样 的 任务 是 一 个 典型 的 采 
样 (sample) 过 程 : 在 这 个 区 间 里 有 无 数 个 点 ， 但 我 们 必须 在 这 些 点 中 选取 有 限 个 点 来 表示 
这 个 函数 。 对 这 个 函数 的 采样 过 程 ， 需 要 选择 一 组 x， 然 后 计算 这 些 x 在 函数 中 对 应 的 y 值 ， 
然后 用 线 将 这 些 连 续 的 点 连 起 来 以 绘制 函数 图 ， 这 就 是 分 段 线性 近似 (piecewise linear 
approximation)。 最 简单 的 方法 是 均匀 地 抽取 x。 首 先 ， 先 确定 样本 大 小 ， 用 区 间 大 小 除 以 
样本 大 小 来 确定 x 的 值 。 为 了 确保 要 绘制 的 点 落 在 可 视 化 的 画布 内 ,根据 区 间 设 置 x 轴 范 
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围 ， 根 据 函数 在 这 个 区 间 的 最 大 值 和 最 小 值 设置 轴 范 围 。 曲 线 的 弯曲 度 取决 于 函数 的 特性 
和 样本 的 大 小 。 如 果 样 本 量 太 小 ， 则 函数 的 图 像 可 能 不 太 准 确 〈 可 能 不 太平 滑 ， 甚 而 会 错过 
主要 的 波动 ); 如 果 样 本 量 太 大 ， 则 生成 图 像 可 能 很 耗 时 ， 因 为 某 些 函数 的 计算 比较 耗 时 (在 
2.4 节 中 ， 我 们 将 介绍 一 种 绘制 平滑 曲线 而 无 unisil pew goubernsi] 
须 使 用 过 多 数量 点 的 方法 )。 你 可 以 使 用 相同 double[] y = new double[n+1]; 
的 技术 绘制 任何 函数 的 函数 图 。 也 就 是 说 ， fi itn pl 了 
你 可 以 决定 你 要 绘制 的 函数 图 像 的 x 取 值 间 for Cint i = 0; i < mi it 人 
隔 ， 计 算 在 恋 间 隔 呐 的 施用 和 值 ”确定 并 设置 7 stabran setXscaTec0 Wt pe 
的 范围 ， 最 后 面 线 将 这 些 点 连接 起 来 。 。 Sera stale (2 2.0) 
轮 廊 和 填充 形状 。StdDraw 还 包括 绘制 圆 StdDraw. lineCx[i-1], y[i-1], x{i], y[i]); 
形 、 正 方形 、 矩形 和 任意 多 边 形 的 方法 。 每 "20 "=200 
个 形状 都 有 一 个 轮廓 。 当 方法 名 称 是 形状 的 
名 称 时 ， 表 示 的 是 使 用 绘图 笔 描 出 该 形状 的 维 瑟 类 
轮廓 。 当 方法 的 名 称 以 filled 开始 时 ， 这 个 名 





称 对 应 的 形状 会 被 填充 为 实心 的 。 以 上 方法 i EE 
我 们 总 结 在 如 下 API 中 : 绘制 一 个 函数 图 


public class StdDraw (形状 ) 





void circle(double x, double y, double radius) 

void filledCircle(double x, double y, double radius) 

void square(double x, double y, double r) 

void filledSquare(double x, double y, double r) 

void rectangle(double x, double y, double r1l, double r2) 

void filledRectangle(double x, double y, double rl1l, double r2) 
void polygon(double[] x, double[] y) 

void filledPolygon(double[] x, double[] y) 


circle() 和 filledCircle() 的 参数 定义 了 一 个 圆心 为 (x, 7)、 半 径 为 > 的 圆 ; square() 和 filled- 
Square() 的 参数 定义 了 以 《x,y) 为 中 心 、 边 长 为 27 的 正方 形 ; rectangle() 和 filled-Rectangle() 
的 参数 定义 了 以 (x,，y) 为 中 心 、 宽 2r 和 高 2 的 矩形; polygon() 和 filledPolygon0 的 参数 
定义 了 一 个 由 线段 连接 的 点 序列 ， 包 括 连接 第 一 个 点 和 最 后 一 点 的 序列 。 


(Xp) 





StdDraw.circle(x, y, rr); StdDraw.square(x, y, r); double[] x = {x0, x1, x2, x3}; 
double[] y = {y0, yl, y2, y3}; 
StdDraw.polygon(x, y); 


文本 和 颜色 。 有 时 你 可 能 希望 在 图 像 中 标注 或 突出 显示 各 种 元 素 。StdDraw 具有 绘制 文 
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本 的 方法 、 用 于 设置 与 文本 相关 参数 的 方法 ， 以 及 用 于 设置 画笔 颜色 的 方法 。 我 们 在 本 书 中 
很 少 使 用 这 些 功能 ,但 它们 非常 有 用 ,特别 是 对 于 计算 机 屏幕 上 的 图 像 。 你 会 在 本 书 官网 上 
发 现 许 多 使 用 它们 的 例子 。 


public class StdDraw (文本 和 颜色 命令 ) 





void text(double x, double y, String s) 
void setFont(Font font) 
void setPenColor(Color color) 


在 这 段 代码 中 ，Font 和 Color 不 是 基本 数据 类 型 ， 你 将 在 3.1 节 中 了 解 到 如 何 定义 这 些 
类 型 。 在 此 之 前 ,我 们 将 细节 留 给 StdtDraw。 可 用 的 颜色 有 黑色 (BLACK)、 蓝 色 . (BLUE 小、 
青色 (CYAN)、 深 灰色 (DARK_GRAY)、 灰 色 (GRAY)、 绿 色 (GREEN)、 浅 灰色 (LIGHT 
GRAY)、 品 红色 (MAGENTA)、 橙 色 ( ORANGE)、 粉 红色 (PINK)、 红 色 (RED)、 白 色 
(WHITE)、 黄 色 (YELLOW ) 和 浅 蓝 色 (BOOK_BLUE)， 所 有 这 些 颜 色 都 被 定义 为 StdDraw 
中 的 常量 。 默 认 颜 色 为 黑色 ， 假 如 调用 StdDraw:setPenColor ( StdDraw.GRAY) 则 改 为 灰色 。 
StdDraw 中 的 默认 字体 适用 于 你 需要 的 大 部 分 图 形 (可 以 在 本 书 官网 上 找到 使 用 其 他 字体 的 
信息 )。 使 用 这 些 方 法 函数 ， 你 可 以 对 绘制 的 图 像 进 行 必要 的 信息 标注 ， 例 如 ,你 可 能 会 使 
用 高 亮 的 方法 来 标注 函数 图 以 凸显 相关 值 。 

形状 、 颜 色 和 文本 是 基本 的 工具 ， 可 用 于 绘制 令 人 眼花 综 乱 的 各 种 图 像 ， 但 你 应 该 着 慎 
使 用 它们 。 使 用 这 样 的 工具 通常 会 带 来 设计 上 的 挑战 ， 而 且 我 们 设计 StdDraw 虽然 遵循 现代 
图 形 库 标准 ， 但 提供 的 命令 是 粗糙 的 ， 因 此 你 可 能 需要 大 量 的 调用 才能 产生 你 设想 的 美丽 图 
像 。 相 比 之 下 ， 使 用 颜色 或 标签 来 帮助 标识 图 像 中 的 重要 信息 则 易于 实现 ， 如 使 用 颜色 来 表 
示 数 据 值 。 

双 缓 冲 。StdDraw 支持 一 种 强大 的 计算 机 图 形 机 制 ， 称 为 双 缓 冲 (double buffering ) 。 
当 通 过 调用 enableDoubleBuffering0O 启用 双 缓 冲 时 ， 所 有 绘图 都 将 发 生 在 缓冲 区 画布 
(offscreen canvas) 上 。 绥 冲 区 画布 不 显示 ; 它 只 存在 于 计算 机 内 存 中 。 只 有 当 你 调用 show() 
时 ， 你 的 图 像 才 从 缓冲 区 画布 复制 到 屏幕 画布 ( onscreen canvas) 上 ， 并 在 标准 绘图 窗口 中 
显示 。 你 可 以 将 双 缓 冲 看 作 收 集 所 有 要 绘制 的 线条 、 点 、 形 


StdDraw. square(.2, .8, .1); 


状 和 文字 的 容器 ， 然 后 根据 请 求 同 时 绘制 缓冲 区 中 的 内 容 。 stdprav-finTedsquareC.a，.8，.2 


双 缓 冲 使 得 你 对 绘图 的 控制 更 加 精确 。 ae 
使 用 双 缓 冲 的 优势 在 于 执行 大 量 绘图 命令 时 的 效率 。 创 Spreadpolyontd ya) 

建 复杂 绘图 时 ， 其 逐步 生成 的 过 程 是 难以 想象 的 。 例 如 ， 你 和 和 are 人 Sblack Eee 

可 以 通过 在 while 循环 之 前 调用 enableDoubleBuffering0， 之 StdDraw. text(.8, .8, "white text"); 

后 调用 show() 来 加 局 程序 1.5.5。 这 会 使 得 所 有 的 点 一 次 同时 

出 现 ， 而 非 每 次 出 现 一 个 。 L] 一 | 
双 缓 冲 最 重要 的 用 途 是 制作 计算 机 动画 (computeranimations)， 

通过 快速 显示 静态 图 形 来 产生 运动 的 幻觉 。 这 种 效果 可 以 使 

科学 现象 动态 可 视 化 。 重 复 以 下 四 个 步骤 就 可 产生 动画 : 天 和 
。 清 除 缓冲 区 画布 。 -一 
。 在 缓冲 区 画布 上 绘制 对 象 。 开打 各 在 而 午 庆 
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。 将 缓冲 区 画布 复制 到 屏幕 画布 上 。 

。 稍 等 片刻 。 

为 了 支持 第 一 步 和 最 后 一 步 ，StdDraw 提供 了 三 个 附加 方法 。clear0 方 法 将 画布 清除 
为 白色 或 指定 颜色 ; pause( 方法 控制 动画 的 显示 速度 ， 其 参数 dt 表示 在 处 理 其 他 命令 前 
StdDraw 等 待 dt 毫秒 。 


public class StdDraw ( 高 级 控制 命令 ) 


void enableDoubleBuffering() 启用 双 缓 冲 
void disableDoubleBuffering() 关闭 双 缓冲 


void show() 将 缓冲 区 画布 复制 到 屏幕 画布 上 

void clear() 清空 画布 并 将 画布 颜色 设置 为 白色 ( 默认 ) 
void clear(Color color) 清空 画布 并 将 画布 颜色 设置 为 参数 color 的 颜色 
void pause(double dt) 暂停 dt 毫秒 


弹跳 球 。 动 画 制作 的 “Hello，World” 程 序 是 制作 一 个 在 画布 上 移动 的 黑色 球 ， 球 根 
据 完 全 弹性 碰撞 规律 弹 离 边界 ( 即 速度 方向 反 转 ， 速 率 没 有 损失 译 者 注 )。 假 设 球 位 
于 位 置 (mm ry)， 我 们 想 创造 一 个 将 其 移动 到 附近 位 置 的 效果 ,假设 这 个 位 置 是 (x+0.01， 
n+0.02 )。 我 们 分 四 个 步 又 来 完成 这 个 动作 : 

。 将 缓冲 区 画布 清除 为 白色 。 

。 在 缓冲 区 画布 上 的 新 位 置 画 一 个 黑色 球 。 

。 将 缓冲 区 画布 复制 到 屏幕 画布 上 。 

。 稍 等 片刻 。 

为 了 创造 出 运动 的 假象 ， 我 们 对 这 个 球 的 整个 位 置 进行 迭代 (在 这 种 情况 下 将 形成 一 
条 直线 )。 没 有 双 缓 冲 的 话 ， 球 的 图 像 将 在 黑色 和 白色 之 间 快 速 办 烁 ， 而 非 平 滑 的 动画 。 
BouncingBall (程序 1.5.6 ) 执行 这 些 步 骤 来 创建 一 个 球 在 以 原点 为 中 心 的 2X2 盒 中 移动 
的 假象 。 球 的 当前 位 置 是 (x, ry)， 每 一 步 , re 加 vi, ry 加 v,， 以 此 来 计算 球 的 新 位 置 。(v，， 
vy) 是 球 在 每 个 时 间 单 位 中 移动 的 固定 距离 ， 所 以 它 代表 球 的 速度 ( velocity)。 为 了 将 球 
保持 在 标准 绘图 窗口 中 ,我 们 根据 弹性 碰撞 的 规律 模拟 球 从 墙壁 上 弹 起 的 效果 。 这 种 效 
果 很 容易 实现 : 当 球 撞 到 垂直 的 墙壁 时 ， 我 们 将 x 方 向 的 速度 从 v; 改变 为 -v:.， 当 球 撞 
到 水 平 墙 时 ， 我 们 将 了 方向 的 速度 从 六 改 为 -=w。 当 然 ， 你 需要 从 本 书 官 网 上 下 载 代码 
并 在 计算 机 上 运行 代码 ， 才 能 清楚 地 查看 到 球 的 运动 状态 。 为 了 使 打印 页 面 上 的 图 像 更 
清晰 ， 我 们 修改 了 BouncingBall， 使 用 灰色 背景 ， 也 可 以 显示 球 的 移动 轨迹 (参见 练习 
3535 

把 标准 绘图 功能 添加 到 我 们 的 编程 模型 中 ， 使 我 们 可 以 “一 图 胜 千言 ”。 这 是 一 套 非 常 
易于 使 用 的 编程 接口 ， 通 过 它 ,， 程 序 可 以 更 开放 地 面 对 真实 世界 ， 也 可 以 轻松 地 实现 科学 
和 工程 函数 和 数据 的 可 视 化 。 我 们 将 在 本 书 中 经 常 使 用 到 这 些 功能 。 因 此 在 最 近 几 个 示例 
程序 上 花费 精力 是 非常 值得 的 。 在 本 书 官网 和 课 后 练习 中 有 更 多 有 用 的 应 用 示例 ， 同 时 你 
也 可 以 深度 使 用 StdDraw 来 应 对 各 种 挑战 及 实现 自我 创意 ,例如 ; 如何 画 一 个 茎 角 星 ? 如 
何 让 反弹 球根 据 实际 情况 反弹 (增加 重力 ) ? 你 会 惊奇 地 发 现实 现 这 些 或 其 他 任务 是 多 么 的 
容易 。 
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程序 1.5.6 ”弹跳 球 





gd class BouncingBall Wey 位 置 
public static void main(String[] args) | pe yx ee 
{ WN 模拟 弹跳 球 的 运动 | ” 球 半径 
StdDraw.setXscale(-1.0, 1.0); | radius 本 


StdDraw.setYscale(-1.0, 1.0); 
double rx = 0.480, ry = 0.860; 
double vx = 0.015, vy = 0.023; 
double radius = 0.05; 
StdDraw.enableDoubleBuffering(); 
while(true) 
{ 人 更 新 球 位 置 并 绘制 
if (Math.abs(rx + vx) + radius > 1.0) vx = -vx; 
if (Math.abs(ry + Vy) + radius > 1.0) vy = -vy; 
FX: += VX; 
ry += Vy; 
StdDraw.clear(); 
StdDraw.filledCircle(rx, ry, radius); 
StdDraw.show() ; 
StdDraw.pause(20); 





该 程序 模拟 弹跳 球 在 坐标 为 -1 和 +1 之 间 的 框 中 的 运动 。 球 根据 
弹性 碰撞 规律 从 边界 反弹 。 即 使 球 的 大 部 分 像素 在 黑色 和 白色 之 间 
交替 ，StdDraw.pause(0 用 20 毫 秒 的 等 待 时 间 保持 黑色 图 像 的 球 持续 出 现 
在 屏幕 上 。 下 图 中 显示 球 的 轨迹 由 该 代码 的 修改 版 本 生成 (参见 练习 
1.5.34) 。 


100 步 200 步 500 步 





以 下 API 表 总 结 了 我 们 研究 过 的 StdDraw 方法 : 


public class StdDraw 
绘图 命令 
void line(double x0, double y0, double x1, double yl1) 
void point(double x, double y) 
void circle(double x, double y, double radius) 
void filledCircle(double x, double y, double radius) 
void square(double x, double y, double radius) 
void filledSquare(double x, double y, double radius) 
void rectangle(double x, double y, double rl, double r2) 
void filledRectangle(double x, double y, double rl, double r2) 
void polygon(double[] x, double[] y) 
void filledPolygon(double[] x, double[] y) 
void text(double x, double y, String s) 
控制 命令 
void setXscale(double x0, double x1) 将 x 坐标 重 置 为 ( x0,x1 ) 


void 
void 
void 
void 
void 
void 
void 


void 


void 
void 


void 


setYscale(double y0, double y1) 
setPenRadius(double radius) 
setPenColor(Color color) 
setFont(Font font) 
setCanvasSize(int w, int h) 
enableDoubleBuffering() 
disableDoubleBuffering() 


show() 


clear(Color color) 
pause(int dt) 
save(String filename) 
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将 y 坐 标 重 置 为 ( y0,y1 ) 

将 笔 半 径 设 置 为 radius 
设置 笔 的 颜色 为 color 

设置 文本 字体 为 font 

将 画布 大 小 设置 为 宽 w， 高 h 

启用 双 绥 冲 

关闭 双 缓 冲 

将 缓冲 区 画布 复制 到 屏幕 画布 
清空 画布 并 将 画布 颜色 设置 为 color 


暂停 dt 毫秒 
保存 为 -jpg 文件 或 ,png 文件 
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注意 ; 具有 相同 名 称 但 无 参数 的 方法 重 置 为 默认 值 。 
标准 绘图 静态 方法 库 的 API 


标准 音频 ”作为 输出 的 基本 抽象 的 最 后 一 个 示例 ， 我 们 来 研究 StdtAudio， 一 个 可 用 于 
播放 、 处 理 和 合成 声音 的 库 。 你 可 能 已 经 用 计算 机 处 理 过 音乐 ， 现 在 你 可 以 通过 编写 程序 来 
做 这 些 事 。 同 时 ， 你 还 将 学 习 计 算 机 科学 与 科学 计算 领域 的 一 个 重要 概念 一 一 数字 信号 处 理 
( digital signal processing)。 当 揭 开 了 这 个 学 科 的 迷人 面纱 时 ， 你 可 能 会 惊讶 于 它 基本 概念 的 
简洁 。 

Concert A。 声 音 是 对 分 子 振动 的 感知 一 一 特别 是 我 们 鼓膜 的 振动 。 因 此 ， 振 动 是 理解 
声音 的 关键 。 也 许 最 简单 的 入 门 方式 是 研究 高 于 中 央 C 的 音符 A， 称 为 Concert A。 这 个 音 
符 就 是 一 个 正弦 波 ， 以 每 秒 440 次 的 频率 振荡 。 函 数 sin(t) 的 周期 是 2 个 单位 ， 所 以 如 果 
我 们 以 秒 为 单位 测量 上 并 绘制 函数 sn (2mtx440 )， 我们 得 到 一 个 每 秒 振荡 440 次 的 曲线 。 
当 你 通过 拨 吉 他 琴 弦 、 吹 小 号 或 使 扬声器 中 的 小 锥 体 振 动 来 演奏 A 时 ， 你 听 到 的 主要 就 是 
这 个 正弦 波 ， 也 就 是 我 们 说 的 concert A 声音 。 我 们 以 赤 兹 (每 秒 周期 数 ) 为 单位 测量 频率 。 
当 你 将 频率 加 售 或 减 半 时 ， 你 可 以 在 刻度 上 向 上 或 向 下 移动 一 个 八 度 音 。 例 如 ，880 赫兹 比 
concert A 高 一 个 八 度 音 ，110 赫兹 比 Concert A 低 两 个 八 度 音 。 作 为 参考 ， 人 类 听力 的 频率 
范围 约 为 20 至 20 000 赫兹 。 声 音 的 幅度 (y 值 ) 对 应 音量 。 我 们 绘制 值 域 在 =1 和 +1 之 间 
的 曲线 ， 并 假设 任何 录制 和 播放 声音 的 设备 都 会 根据 需要 进行 缩放 ， 当 转动 音量 旋钮 时 ， 将 
进一步 缩放 。 











音符 ”i ”频率 
二 dr WE 
A 0 440.00 PURNA ANE A/ NAN 
Ar 或 B 1 466.16 人 YNvASAWNASARSAR 
B 2 “493.88 "NANO REN NIN ON 
C 3 1 -32325 NA NA 八 人 A 
Cis 或 D4 554.37 WA VAN NY 
D. 5 过 587.33 N/V NN SNA NIN 
Dt 或 E 6 622.25 入 AUWMVVVMVVVWVNVAVAA 
AVVVYVYVYVVYYNY 
0235°7.81012 人 : ci M/VVVVYVVVVVVYY 
J Fs 或 G9 739,99 MNNVYYYVYVVVVAAN 
ED G 10 783.99 440x22 AMVVVVVVVVVVVVVAA 
Gs 或 A 11 830:61 NMVVVVVVVVVVVVANWA 
A 12 “880.00 ANANAANNANANNWVVVVVVA 
音符 、 数 字 和 波形 


其 他 音符 。 一 个 简单 的 数学 公式 表征 了 半音 音阶 上 的 其 他 音符 。 半音 音阶 上 有 12 个 音 
符 ， 以 对 数 〈 底 数 为 2 ) 刻度 均匀 间隔 。 我 们 将 它 的 频率 乘 以 2 的 (i/12 ) 次 方 得 到 给 定 音 


符 上 方 的 第 i 个 音符 。 换 句 话说 ， 半 音 音 阶 中 的 每 个 音符 的 频率 正好 是 音阶 中 前 一 音符 的 
频率 乘 以 2 的 1/12 次 方 ( 约 1.06 )。 你 会 惊喜 地 发 现 ， 有 了 这 些 信息 就 可 以 用 来 创造 音乐 
了 ! 例如 ， 要 播放 曲子 《 Frere Jacques 》， 只 需 按 照 适 当 频 率 产 生 正 弱 波 来 演奏 音符 “AB 
C # A”， 每 个 音符 半 秒 ， 然 后 重复 。StdAudio 库 中 的 基础 方法 StdAudio.play() 可 以 完成 此 
操作 。 

采样 。 对 于 数字 声音 ， 我 们 以 规定 的 间隔 进行 采样 来 表示 曲线 ， 与 我 们 绘制 函数 图 时 的 
方式 完全 相同 。 我 们 经 常 通过 充分 采样 以 准确 地 表示 曲线 一 一 广泛 使 用 的 数字 声音 采样 率 是 
每 秒 44 100 个 样本 。 对 于 Concert A， 该 采样 率 相当 于 绘制 正弦 波 的 每 个 周期 需要 大 约 100 
个 样本 。 由 于 我 们 使 用 标准 化 的 采样 时 间 间 隔 ， 我 们 只 需要 计算 采样 点 的 坐标。 这 很 简 
单 : 我 们 将 声音 表示 为 实数 数组 (在 -1 和 +1 之 间 )。 按照 这 个 设计 方法 ，StdAudio.play() 
方法 需要 一 个 数组 作为 参数 ， 数 组 中 的 每 一 项 表示 的 是 相应 采样 的 音量 运行 该 方法 能 够 在 
计算 机 上 演奏 该 数组 表示 的 音乐 。 

例如 ， 假 设 你 想 播放 Concert A 10 秒 钟 ， 每 秒 44 100 个 样本 ,你 需要 一 个 长 度 为 
441 001 的 double 类 型 数组 。 为 了 填充 数组 ， 使 用 for 循 环 在 人 0/44 100、1/44 100、2/ 
44 100、3/44 100、…、441 000/44 100 处 对 函数 sin( 2mtX440 ) 进行 采样 。 一 旦 我 们 得 到 
数组 的 各 项 值 ， 我 们 就 可 以 使 用 StdAudio.play() 了 。 代 码 如 下 : 





int SAMPLING_RATE = 44100; 7W/ 每 秒 样 本 数 
int hz = 440; Nconcert A 
double duration = 10.0; A 10 秒 


int n = (int) (SAMPLING_ RATE * duration); 

double[] a = new double[n+1]; 

for (int 1 = 0; 1 <= ni i++) 

a[i] = Math.sinC2*Math.PI * i * hz / SAMPLING_RATE); 

StdAudio.play(a); 

这 段 代码 是 数字 音频 的 “Hello，World”。 一 旦 你 理解 如 何 使 用 它 来 让 你 的 计算 机 播放 
这 个 音符 ， 你 可 以 编写 代码 来 播放 其 他 音符 和 制作 音乐 ! 创建 声音 和 绘制 振荡 曲线 之 间 的 区 
别 不 过 是 输出 设备 不 同 。 实 际 上 ， 向 标准 绘图 和 标准 音频 发 送 相同 的 数字 是 非常 有 趣 的 ， 也 
会 给 你 带 来 很 多 启发 ( 见 练习 1.5.27 )。 

保存 到 文件 。 音 乐 须 占 用 计算 机 的 大 量 存储 空间 。 每 秒 44 100 个 样本 ， 四 分 钟 的 歌曲 
对 应 于 4X60X44 100=10 584 000 个 数字 。 因 此 ， 通 常 使 用 二 进 制 格式 来 表示 对 应 歌曲 的 
数字 ， 这 样 占用 的 空间 要 比 我 们 用 字符 数字 表示 占用 的 空间 要 小 。 近 年 来 开发 出 了 许多 这 样 
的 格式 一 一 StdAudio 使 用 .wav 格式 。 你 可 以 在 本 书 官网 上 找到 关于 .wav 格式 的 一 些 信息 ， 
但 是 你 不 需要 了 解 详细 信息 ， 因 为 StdAudio 会 为 你 处 理 转换 。 我 们 的 标准 音频 库 允 许 你 读 
取 .wav 文件 、 写 入 .wav 文件、 将 .wav 文件 转换 为 double 类 型 数组 以 进行 处 理 。 

PlayThatTune (程序 1.5.7 ) 是 一 个 示例 ， 显 示 如 何 使 用 StdAudio 将 你 的 计算 机 变 成 乐 
器 。 它 从 标准 输入 得 到 音符 ， 从 Concert A 的 半音 音阶 上 索引 ， 并 在 标准 音频 播放 。 这 只 是 
一 个 基本 方案 ， 你 可 以 想到 很 多 方式 扩展 其 功能 ， 我 们 在 课 后 练习 中 也 做 了 一 些 扩展 。 

之 所 以 能 够 在 基本 的 编程 工具 库 中 引入 标准 音频 ， 是 因为 声音 的 处 理 是 一 种 非常 重要 的 
科学 计算 的 应 用 。 从 应 用 的 角度 看 ， 数 字 信 号 处 理 的 商业 化 应 用 对 现代 社会 产生 了 显著 的 影 
响 ， 而 从 科学 和 工程 的 角度 看 ， 它 是 物理 学 与 计算 机 科学 的 有 趣 结合 。 本 书 稍 后 将 详细 研究 
数字 信号 处 理 的 更 多 内 容 (例如 ， 你 将 在 2.1 节 中 学 习 如 何 创 建 比 PlayThatTune 产生 的 纯音 
乐 更 具 乐 感 的 声音 )。 
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1/40 秒 (各 种 采样 率 ) 44 100 个 样本 / 秒 (各 种 时 间 ) 
3 ct l 1/40 秒 ，1102 个 样本 


171000 秒 
1/200 秒 ，220 个 样本 


1/ 1000 秒 
17 1000 秒 ，44 个 样本 
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程序 1.5.7 ”数字 信号 处 理 
dy class PlayThatTune | pitch | 到 A 的 距离 了 
public static void main(String[] args) duration | 音符 播放 时 间 
{ /A 从 StdIn 读 一 首 曲 子 并 播放 它 | hz | 频率 . 
int SAMPLING_RATE = 44100; n 样本 数 
while (C!StdIn.isEmpty()) a[] “| 采样 后 的 正 蓄 波 了 


{ WU 读 取 一 个 音符 并 播放 它 
int pitch = StdIn.readInt(); 
double duration = StdIn.readDouble0); 
double hz = 440 * Math.pow(2, pitch / 12.0); 
int n = (int) (SAMPLING_RATE * duration); 
double[] a = new double[n+1]; 
for Cint i1 = 0;-1i <="n; i1++) 
a[i] = Math.sin(2*Math.PI * 1 * hz / SAMPLING_RATE); 
StdAudio.play(a); 


该 数据 驱动 程序 将 你 的 计算 机 变 成 乐器 。 它 从 标准 输入 读 取 音符 和 
持续 时 间 ， 并 按照 规定 时 间 播 放 音符 代表 的 纯音 。 每 个 音符 被 指定 为 一 个 
音 高 ( 与 Concert A 的 距离 ) 。 读 取 每 个 音符 和 持续 时 间 后 、 该 程序 以 每 秒 
44100 个 样本 的 指定 采样 频率 和 持续 时 间 对 正 弱 波 采样 来 创建 数组 ， 并 使 用 
StdAudio.play0 播 放 它 - 


re elise.txt 





% java PlayThatTune < elise.txt 
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下 面 的 API 表 总 结 了 StdAudio 中 的 方法 : 
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public class StdAudio 





void play(String filename) 播放 给 定 的 .wav 文 件 
void play(double[] a) 播放 给 定 的 声波 
void play(double x) 将 x 作为 采样 样本 播放 1/44 100 秒 
void save(String filename，double[] a) 保存 到 一 个 .wav 文 件 
double[] read(String filename) 从 一 个 .wav 文 件 读 取 
标准 音频 静态 方法 库 的 API 


总 结 ”标准 输入 、 标 准 输出 、 标 准 绘图 和 标准 音频 抽象 化 的 益处 尽 可 以 淋漓 尽 致 地 体现 
在 WO 上 : 它 可 以 在 不 同时 间 连 接 到 不 同 的 物理 设备 ， 并 且 不 必 对 程序 进行 任何 更 改 。 虽 然 
设备 有 显著 差异 ， 但 我 们 可 以 编写 能 够 进行 IO 的 程序 ， 而 不 依赖 于 特定 设备 的 属性 。 从 现 
在 开始 ， 我 们 将 在 本 书 的 几乎 所 有 程序 中 使 用 StdOut、StdIn、StdDraw 和 /或 StdAudio 的 
方法 。 为 了 方便 , 我们 将 这 些 库 统称 为 Std*。 使 用 这 些 库 的 重要 优势 在 于 可 以 将 程序 切换 
到 更 快 、 更 廉价 或 能 够 存储 更 多 数据 的 新 设备 上 ， 而 无 须 更 改 程序 。 在 这 种 情况 下 ， 连 接 的 
细节 是 你 的 操作 系统 和 Std * 实现 之 间 需 要 解决 的 问题 。 在 现代 系统 中 ， 新 设备 通常 配 有 相 
应 的 软件 ， 能 够 自动 地 与 Java 和 操作 系统 建立 连接 。 
问答 环节 

问 : 怎样 将 StdIn、StdOut、StdDraw 和 StdAudio 用 于 Java ? 

答 : 如 果 你 按照 本 书 官网 中 的 说 明 一 步 步 安 装 Java， 则 这 些 库 应 该 已 经 能 在 Java 中 使 
用 了 。 或 者 ， 你 可 以 从 本 书 官网 中 复制 StdIn.java、StdOut.java、StdDraw.java 和 StdAudio. 
java 文件 ， 并 与 使 用 它们 的 程序 放 在 同一 目录 下 。 

问 : 错误 消息 异常 “Exception in thread "main" java.lang.NoClassDefFoundError: StdIn” 
是 什么 意思 ? 

答 : 库 StdIn 没有 配置 到 你 的 Java 环境 中 ， 请 参考 上 一 题 进行 配置 。 

问 : 为 什么 我 们 不 使 用 标准 Java 库 处 理 输入 、 图 形 和 声音 ? 

答 : 我 们 正在 使 用 它们 ， 但 我 们 喜欢 用 更 简单 的 抽象 模型 。StdIn、StdDraw 和 
StdAudio 背后 的 Java 库 用 于 产品 编程 ， 这 些 库 和 它们 的 API 不 够 轻便 。 要 了 解 它们 是 什么 
样子 ， 请 查看 StdIn.java、StdDraw.java 和 StdAudio.java 中 的 代码 。 

问 : 如 果 我 使 用 %2.4f 这 种 格式 来 表示 double 类 型 值 ， 我 将 得 到 一 个 小 数 点 前 有 2 位 、 
小 数 点 后 有 4 位 的 数字 ， 对 吗 ? 

答 : 不 ， 它 表示 小 数 点 后 有 4 位 数字 。 第 一 个 值 是 整个 字段 的 宽度 。 你 要 使 用 格 
式 %7.2f 指定 一 共有 7 个 字符 ， 小 数 点 前 有 .4 位 ， 小 数 点 占 一 位 ， 小 数 点 后 有 2 位 。 

问 : printf() 有 哪些 其 他 转换 码 ? 

答 : 对 于 整数 值 ，o 表示 八进制 ，x 表示 十 六 进 制 。 日 期 和 时 间 也 有 许多 格式 。 有 关 详 
细 信 息 请 参阅 本 书 官网 。 

问 : 我 的 程序 可 以 从 标准 输入 重新 读 取 数 据 吗 ? 

答 : 不 可 以 ,你 只 能 读 取 一 次 ， 就 像 你 无 法 撤销 println0( 命令 一 样 。 

问 : 如 果 我 的 程序 在 耗 尽 标准 输入 中 的 值 后 尝试 从 标准 输入 读 取 数据 ， 会 发 生 什么 ? 

答 : 你 会 得 到 一 个 错误 。StdIn.isEmpty() 允许 你 通过 检查 是 否 还 有 更 多 的 输入 ， 以 此 来 
避免 这 样 的 错误 。 
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问 : 为 什么 StdDraw.square (x，y，T) 绘制 的 正方 形 的 宽度 为 2r 而 不 是 r+ ? 

答 : 这 使 得 它 与 函数 StdDraw.circle (x; yy r) 一 致 ， 其 中 第 三 个 参数 是 圆 的 半径 ， 而 
不 是 直径 。 在 这 个 例子 中 ,rz 是 能 够 在 正方 形 内 部 画 出 的 最 大 圆 的 半径 。 

问 : 我 的 终端 窗口 在 StdAudio 程序 结束 时 挂 起 ， 我 不 得 不 使 用 <Ctrl-C> 让 命令 提示 符 
重新 显示 出 来 。 如 何 避 免 这 种 现象 ? 

答 : 添加 一 个 调用 System.exit(0) 作为 main() 的 最 后 一 行 。 不 要 问 为 什么 。 

问 : 为 PlayThatTune 制作 输入 文件 时 ， 能 和 否 使 用 负 整 数 来 指定 低 于 Concert A 的 音符 ? 

答 : 可 以 。 其 实 我 们 把 Concert A 置 于 0 是 随意 选 的 ， 并 不 是 一 个 固定 的 设计 。 一 个 流 
行 的 标准 称 为 MIDI 调 音 标准 ， 它 从 低 于 Concert A 五 个 八 度 的 C 开始 编号 。 根 据 MIDI 标 
准 ，Concert A 为 69， 你 不 需要 使 用 负数 。 

问 : 当 我 尝试 校 验 30 000 赫 效 (或 更 高 ) 频率 的 正弦 波 时 ， 为 什么 在 标准 音频 上 听 到 奇 
怪 的 结果 ? 

答 : 奈 奎 斯 特 频率 (Nyquist frequency) 定义 为 采样 频率 的 一 半 ， 表 示 可 以 再 现 的 最 高 
频率 。 对 于 标准 音频 ， 采 样 频率 为 44 100 赫 北 ， 奈 奎 斯 特 频率 为 22 050 赫兹 。 


练习 


1.5.1 编写 从 标准 输入 读 取 整 数 (用户 输入 多 少 读 取 多 少 ) 的 程序 ， 并 打印 最 大 值 和 最 小 值 。 
1.5.2 ”修改 前 一 个 练习 的 程序 ， 确 保 整数 必须 是 正 的 ( 当 输 入 的 值 不 是 正 数 时 提示 用 户 输 入 正 整数 )。 
1.5.3 ”编写 一 个 程序 ， 要 求 输入 一 个 整 型 命令 行 参 数 n， 然 后 从 标准 输入 读 取 nn 个 浮 点 数 ， 并 打印 它 
们 的 均值 (平均 值 ) 和 样本 标准 差 (它们 与 均值 的 差 值 的 平方 和 的 平方 根 ， 除 以 n-1 )。 
1.5.4 扩展 前 一 个 练习 的 程序 ， 创 建 一 个 从 标准 输入 读 取 n 个 浮 点 数 的 过 滤器 ， 打 印 出 比 均值 大 1.5 
个 标准 差 的 浮 点 数 。 

1.5.5 ”编写 一 个 读 取 整 数 序列 的 程序 ， 并 打印 出 连续 出 现 次 数 最 多 的 整数 和 连续 出 现 的 次 数 。 例 如 ， 
如 果 输 入 为 “1221511777711”， 则 程序 应 打印 “最 大 连续 序列 是 4 个 7”。 

1.5.6 ”编写 一 个 读 取 整 数 序 列 并 打印 整数 的 过 滤器 ， 删 除 连续 出 现 的 重复 值 。 例 如 ， 如 果 输 入 是 “1 2 
21511T7777111111111”; 你 的 程序 应 打印 “T215171”% 

1.5.7 编写 一 个 程序 ， 需 要 输入 一 个 整数 型 命令 行 参数 n， 然 后 读 取 1 到 n 之 间 的 n-1 个 不 同 的 整数 ， 
并 确定 缺少 的 值 。 

1.5.8 ”编写 一 个 程序 ,以 标准 输入 读 取 正 浮 点 数 ， 并 打印 其 几何 平均 数 和 调和 平均 数 。7z 个 正 数 坟 ， 
训 ，…，Xn 的 几何 平均 数 为 《xiXx2X… Xt) 。 调 和 平均 数 为 n/( 1/xit1/xz+…+1/x。)。 提 示 : 
对 于 几何 平均 数 ， 考虑 采取 对 数 以 避免 溢出 。 

1.5.9 假设 文件 input.txt 只 包含 两 个 字符 串 “F” 和 “F”， 下 面 命令 的 运行 效果 如 何 (参见 练习 1.2.35 )? 


% java Dragon < input.txt | java Dragon | java Dragon 
public class Dragon 
public static void main(String[] args) 


String dragon = StdIn.readString(); 
String nogard = StdIn.readString(); 
StdOut.print(dragon + "L" + nogard); 
StdOut.print(" "); 
StdOut.print(dragon + "R" + nogard); 
StdOut.print1nO; 
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1,5.10 
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1.5.19 


甸 了 工 茧 


编写 一 个 过 滤器 TenPerLine， 从 标准 输入 读 取 0 到 99 之 间 的 整数 序列 并 打印 出 来 ， 每 行 10 个 
整数 ， 列 对 齐 。 然 后 编写 一 个 程序 RandomIntSeq， 它 使 用 两 个 整 型 命令 行 参数 m 和 nn， 并 在 0 
和 m-1 之 间 打 印 n 个 随机 整数 。 使 用 命令 java RandomIntSeq 200 100 | java TenPerLine 
测试 你 的 程序 。 
编写 从 标准 输入 读 取 文本 的 程序 ， 并 打印 文本 中 的 单词 数 。 为 了 简化 题目 ， 我 们 约定 一 个 单词 
是 指 由 空格 包围 着 的 非 空白 字符 序列 。 
编写 一 个 程序 ， 从 标准 输入 读 取 行 ， 每 行 包 含 一 个 名 称 和 两 个 整数 ， 然 后 使 用 printf() 打印 一 
个 表格 ， 一 列 为 名 称 ， 一 列 为 这 两 个 整数 ， 一 列 是 第 一 个 数 除 以 第 三 个 数 的 结果 ， 精 确 到 小 
数 点 后 三 位 。 你 可 以 使 用 这 样 的 程序 制作 棒球 运动 员 的 击 球 平均 值 表 或 学 生成 绩 表 。 
编写 一 个 程序 ， 打 印 每 月 付款 、 剩 余 本 金 和 贷款 利息 的 表格 ， 将 以 下 三 个 数字 作为 命令 
数 : 年 数 、 本 金 和 利率 ( 见 练习 1.2:24 )。 
以 下 哪 一 项 要 求 将 来 自 标准 输入 的 所 有 值 保存 下 来 (例如 ， 使 用 数组 来 保存 ) 哪些 可 以 仅 使 
用 固定 数量 的 变量 来 实现 ? 对 于 每 个 选项 ， 输 入 来 源 是 指 来 自 标准 输入 的 n 个 实数 ,分 布 在 0 
和 1 之 间 。 
。 打印 最 大 的 数字 和 最 小 的 数字 。 
。 打印 n 个 数字 的 平方 和 。 
。 打印 n 个 数字 的 平均 值 。 
。 打印 n 个 数字 的 中 位 数 。 
。 打印 大 于 平均 值 的 数字 的 百分比 。 
。 打印 n 个 数字 ， 以 升序 排列 。 
。 以 随机 顺序 打印 n 个 数字 。 
编写 一 个 程序 ， 它 需要 三 个 double 类 型 命令 行 参 数 x、y 和 z， 从 标准 输入 读 取 一 系列 点 坐标 
的 信息 (x, ys zi)， 并 打印 最 接近 x, y,z) 的 点 的 坐标 。 回 想 一 下 ，(x,y,z) 和 (xi, yi zi) 之 间 
距离 的 平方 是 (x-xi) + (y-yi) "+ (z-zi) *。 为 了 提高 效率 ,不 要 使 用 Math.sqrt()。 
给 定 一 系列 物体 的 位 置 和 质量 ， 编 写 一 个 程序 来 计算 它们 中 心 的 质量 或 质心 。 质 心 是 nn 个 物体 
的 平均 位 置 ， 以 质量 为 单位 。 如 果 位 置 和 质量 由 (xi, yi, mi) 给 出 ， 则 质心 (x,y, m) 由 下 式 得 出 : 
m=mit+m2t+***+m 
X=(mi xit+***+mn Xn)/m 
y= (m1 yt tm yn)/m 
编写 一 个 程序 ， 读 取 -1 和 +1 之 间 的 实数 序列 ， 并 打印 它们 的 平均 幅度 、 平 均 功 率 和 和 零 交 又 
数 。 平 均 幅 度 ( average magnitude) 是 数据 绝对 值 的 平均 值 。 平 均 功 率 (average power) 是 数 
据 平方 的 平均 值 。 零 交叉 数 (zero crossing) 是 数据 从 严格 负数 转换 为 严格 正 数 的 次 数 ， 反 之 
亦 然 。 这 三 个 统计 数据 被 广泛 用 于 分 析 数 字 信 号 。 
编写 一 个 程序 ， 需要 输入 整 型 命令 行 参数 n， 并 绘制 一 个 带 有 红色 和 黑色 正方 形 的 nxn 棋盘 。 
将 左下 方 的 正方 形 设置 成 红色 。 
编写 一 个 程序 ， 命 令 行 参数 为 整数 n 和 浮 点 数 p (0 到 1 之 间 )， 在 一 个 圆 的 圆周 上 绘制 n 个 等 
间隔 点 ， 对 于 任意 一 对 点 ， 其 间 存 在 连接 线 的 概率 为 p， 则 画 一 条 灰 线 连接 它们 。 
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1.5.20 ”编写 代码 来 画 红 桃 、 黑 桃 、 梅 花 和 方块 。 红 桃 的 画 法 为 : 先 画 一 个 实心 蓉 形 ， 然 后 在 左上 角 和 
右上 角 附 上 两 个 实心 的 半圆 。 

1.5.21 ”编写 一 个 程序 ， 需 要 一 个 整 型 命令 行 参数 n， 通 过 绘制 函数 r=sin (za6) 从 0 到 2r 弧度 的 极 坐 
标 (rx，0) 来 画 出 n 个 花 久 (如果 1n 为 奇数 ) 或 2n 个 花 准 (如 果 赤 为 偶数 ) 的 玫瑰 。 


美 大 汪 类 


L522 一 个 程序 ， 它 接受 一 个 字符 串 命 令 行 参数 s， 并 将 这 个 字符 串 以 横幅 样式 显示 在 屏幕 上 ， 
A 并 在 到 达 屏 幕末 尾 时 回 到 字符 串 开始 出 现 的 地 方 。 添 加 第 二 个 命令 行 
参数 来 控制 速度 。 165 


1.5.23 ”修改 PlayThatTune， 添 加 额外 的 命令 行 参数 来 控制 音量 (将 每 个 样本 值 乘 以 音量 ) 和 音乐 速度 
(将 每 个 音符 的 持续 时 间 乘 以 速度 )。 

1.5.24 ”编写 一 个 将 a .wav 文件 名 称 和 播放 速率 r 作为 命令 行 参数 的 程序 ， 并 以 给 定 速率 播放 文件 。 首 
先 ， 使 用 StdAudio.read0 将 文件 读 入 数组 a[ ]。 如 果 rc=1， 则 播放 a[ ] ; 否则 ,创建 一 个 新 的 
数组 b[]， 其 大 小 为 + 乘 以 a[ ] 的 长 度 。 如 果 r<1， 则 从 原始 文件 采样 填充 b[ ]; 如 果 rt>1， 则 
从 原始 文件 插值 来 填充 b[ ]。 然 后 播放 b[ ]。 

1.5.25 ”编写 程序 使 用 StdDraw 生成 以 下 每 个 图 案 。 


1.5.26 编写 一 个 名 为 Circles 的 程序 ， 这 个 程序 在 单位 正方 形 内 的 随机 位 置 绘制 随机 半径 的 实心 圆 ， 
产生 如 下 所 示 的 图 像 。 你 的 程序 应 该 有 四 个 命令 行 参数 : 圆 的 数量 、 实 心 圆 所 占 比 例 、 最 小 
半径 和 最 大 半径 。 





人 1 0.01 01 100 1 0.01 0.05 500 0.5 0.01 0.05 50 0.75 0.1 0.2 
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创新 练习 


1.5.27 可视化 音频 ( Visualizing audio)。 修 改 PlayThatTune 将 要 播放 的 值 发 送 到 标准 绘图 ， 以 便 你 可 
以 在 播放 音频 时 观看 声波 。 你 将 必须 在 绘图 画布 上 绘制 多 条 曲线 来 同步 声音 和 图 像 。 

1.5.28 ”统计 投票 Statistical polling)。 在 收集 某 些 政治 民意 调查 的 统计 数据 时 ， 获 得 正式 选民 的 客观 
样本 是 非常 重要 的 。 假 设 你 有 一 个 具有 nn 个 注册 选民 的 文件 ， 每 行 有 一 个 注册 选民 。 写 一 个 
过 滤器 ， 打 印 一 个 大 小 为 m 的 均匀 随机 样本 (参见 程序 1.4.1 )。 

1.5.29 ”地 形 分 析 ( Terrain analysis)。 假 设 地 形 由 三 维 网 格 的 高 程 值 表示 (以 米 为 单位 )。 如 果 一 个 网 格 
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点 是 峰值 (peak)， 那 么 该 点 的 四 个 相 邻 单元 格 ( 左 ， 右 ， 上 ， 下 ) 的 高 程 值 严格 低 于 峰值 点 的 高 
程 值 。 编 写 Peaks 程序 ， 使 其 能 够 从 标准 输入 中 读 取 地 形 ， 然 后 计算 并 打印 地 形 中 的 峰值 数量 。 
直方 图 (Histogram)。 假 设 标准 输入 流 是 一 个 double 类 型 的 值 序列 。 编 写 一 个 程序 ， 需 要 
整数 mn、 两 个 实数 lo 和 hi 作为 命令 行 参数 ， 将 区 间 (lo,hi) 分 成 n 个 相等 区 间 ， 统计 标准 输 
入 流 中 的 数字 落 在 其 中 每 个 区 间 的 数目 ， 使 用 StdDraw 绘制 一 个 直方 图 表示 这 个 统计 结果 。 
螺旋 体 ( Spirographs)。 编 写 一 个 程序 ， 该 程序 需要 三 个 double 型 命令 行 参数 R、r 和 a， 并 绘 
制 一 个 螺旋 体 = 螺旋 体 图 案 (技术 上 是 外 摆 线 ) 是 通过 在 较 大 的 圆 (半径 为 R) 的 内 侧 滚动 较 
小 的 圆 〈 半 径 为 z) 而 形成 的 曲线 。 如 果 笔 与 深 动 圆 的 中 心 的 距离 是 (rta)， 那 么 在 t 时 刻 所 得 
曲线 等 式 由 下 式 给 出 : 
X(t)=(R+r)cos(t)-(r+a) cos((R+r)t/r) 
y(tD)=(R+r)sin(f)-(rta) sin((R+r)t/r) 

这 种 曲线 被 一 种 畅销 的 玩具 所 推广 ， 这 种 玩具 包含 边缘 有 齿轮 的 圆 盘 ， 还 有 一 些小 孔 ， 
你 可 以 把 一 支 笔 放 在 孔 里 画 出 螺旋 体 的 轨迹 。 
时 钟 (Clock)。 编 写 一 个 显示 模拟 时 钟 的 秒 、 分 、 时 动画 的 程序 ， 使 用 方法 StdDraw.pause 
(1000 ) 大 约 每 秒 更 新 一 次 显示 。 
示波器 (Oscilloscope)。 编 写 一 个 模拟 示波器 输出 的 程序 并 产生 李 萨 如 图 形 (Lissajous 
patterns)。 这 些 图 形 是 以 法 国 物理 学 家 Jules A. Lissajous 的 名 字 命 名 的 ， 他 研究 了 当 两 个 相互 
垂直 的 周期 性 振动 同时 发 生 时 所 产生 的 图 案 。 假 设 输入 是 正弦 曲线 ， 因 此 下 面 的 参数 方程 描 
绘 这 个 曲线 : 

X(t)=Ax sin (Wxt +0.) 
y(D=Ay sin (wyt +0,) 

从 命令 行 获取 六 个 参数 4:、w:、0Q:.、A,、w,、0y。 
有 轨迹 的 弹跳 球 (Bouncing ball with tracks ) 。 修 改 程序 BouncingBall， 以 使 其 生成 本 书 中 展示 
的 图 像 ， 并 在 灰色 背景 上 显示 球 的 轨迹 。 
有 重力 的 弹跳 球 ( Bouncing ball with gravity)。 修 改 程序 BouncingBall， 以 使 其 在 垂直 方向 包 
含 重力 因素 。 调 用 StdAudio.play()， 在 球 撞击 墙壁 时 添加 声音 效果 ， 并 在 撞击 地 板 时 产生 不 同 
的 音效 。 
随机 奏 乐 ( Random tunes)。 编 写 一 个 程序 使 用 StdAudio 随机 产生 音律 。 尝 试 通过 保持 一 定 的 
曲调 、 调 高 整 拍 的 概率 、 增 加 重复 以 及 其 他 规则 等 ， 使 程序 尽量 生成 合理 的 旋律 。 
瓷砖 图 案 (Tile patterns)。 使 用 你 在 练习 1.5.25 中 得 出 的 解决 方案 ,编写 一 个 程序 TilePattern， 
它 需 要 一 个 整 型 命令 行 参 数 n， 然 后 使 用 你 选择 的 瓷砖 来 绘制 一 个 nXn 图 案 。 第 二 个 命令 行 
参数 用 来 选择 棋盘 格式 ， 第 三 个 命令 行 参 数 用 来 选择 颜色 s 使 用 下 面 的 图 案 作为 起 点 ， 设 计 
一 个 瓷砖 地 板 。 要 有 创意 ! 注意 : 这 些 图 案 都 是 古老 的 设计 ， 你 可 以 在 许多 古代 (和 现代 ) 的 
建筑 中 找到 它们 。 








1.6 “案例 研究 : 随机 网 络 冲浪 


通过 网 络 进行 交流 已 经 成 为 日 常生 活 中 不 可 或 缺 的 一 部 分 。 我 们 能 通过 这 种 方式 顺畅 交 
流 ， 在 一 定 程 度 上 得 益 于 对 网 络 结构 的 科学 研究 ， 这 是 自 网 络 技术 产生 以 来 就 在 积极 研究 的 
课题 。 接 下 来 我 们 研究 一 个 简单 的 网 络 模型 ， 这 是 一 个 有 效 地 理解 网 络 特性 的 方法 。 这 种 模 
型 的 变 体 被 广泛 使 用 ， 并 成 为 网 络 搜索 爆炸 式 增长 的 关键 因素 。 

该 模型 被 称 为 随机 冲浪 (iandom surfer) 模型 。 这 种 模型 非常 简单 。 我 们 将 网 络 看 作 是 
一 组 固定 的 网 页 ， 每 个 网 页 都 包含 一 组 超 链接 ( hyperlink)， 每 个 超 链 接 都 链接 到 其 他 网 页 
(为 了 简洁 起 见 ， 我们 使 用 术语 网 页 和 和 链接)。 本 节 中 我 们 研究 网 络 冲 浪 者 在 网 页 间 随 机 跳 转 
的 过 程 ， 他 们 通过 在 地 址 栏 中 输入 网 页 名 称 ， 或 者 单 击 当 前 网 页 上 的 链接 来 跳 转 。 

网 络 链接 结构 的 基础 数学 模型 被 称 为 图 ( graph)， 我 们 将 在 本 书后 半 部 分 (4.5 节 ) 详细 
研究 图 及 图 的 处 理 。 现 在 我 们 专注 于 一 个 自然 的 、 精 
心 研究 的 概率 模型 相关 的 计算 ， 这 个 模型 准确 地 描述 汪汪 
了 随机 冲浪 者 的 行为 。 

研究 随机 冲浪 模型 的 第 一 步 是 用 公式 更 精确 地 表 
示 它 。 问 题 的 关键 在 于 明确 网 页 之 间 随 机 跳 转 的 意义 。 
接 下 来 我 们 使 用 一 种 直观 的 90-10 规则 描述 跳 转 到 新 网 
页 的 两 种 方法 : 假设 随机 冲浪 者 有 90% 的 概率 会 通过 
随机 点 击 当 前 网 页 上 的 链接 实现 跳 转 (每 个 链接 以 相等 
的 概率 被 选中 )， 另 外 10% 的 概率 随机 冲浪 者 会 直接 进 
入 一 个 随机 网 页 (例如 ， 以 手动 输入 网 址 的 形式 打开 网 过 页 
页 一 一 译 者 注 )( 网 络 上 所 有 网 页 被 选中 的 概率 相同 )。 ee ssh 

你 很 快 会 发 现 这 个 模型 有 缺陷 ， 因 为 你 从 自身 的 ne 
经 验 中 知道 一 个 真正 的 网 络 冲 浪 者 的 行为 并 不 是 那么 
简单 : 网 页 和 链接 
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102 党 了 工 间 


。 没 有 人 以 相等 的 概率 选择 链接 或 网 页 。 

。 不 可 能 以 均等 的 概率 直接 浏览 整个 互联 网 上 的 每 一 个 网 页 。 

。90-10 (或 任何 固定 ) 的 分 类 只 是 一 个 猜测 。 

。 它 不 考虑 后 退 按钮 或 书签 。 

尽管 存在 这 些 缺 陷 ， 但 是 这 个 模型 足够 丰富 ， 使 得 计算 机 科学 家 忽略 了 这 些 缺 陷 而 对 网 
络 的 性 质 进 行 了 许多 研究 。 根 据 这 个 模型 ， 你 可 以 研究 一 下 本 节 前 文中 的 小 例子 ， 你 认为 随 
机 冲浪 者 最 可 能 访问 哪个 网 页 ? 

每 个 使 用 网 络 的 人 的 行为 都 有 点 像 随机 冲浪 者 ， 所 以 建立 网 络 基础 设施 和 网 络 应 用 程序 
的 人 对 了 解 随机 冲浪 者 的 行为 非常 感 兴 趣 。 该 模型 是 了 解数 十 亿 网 络 用 户 体验 的 工具 。 在 本 
节 中 ， 你 将 使 用 本 章 中 学 习 的 基本 编程 工具 来 研究 该 模型 及 其 含义 。 

输入 格式 ”我 们 希望 能 够 在 各 种 图 上 研究 随机 冲浪 者 的 行为 ， 而 不仅 仅 是 一 个 例子 。 因 
此 ， 我 们 要 编写 数据 驱动 代码 (data-driven code), 保存 数据 文件 ， 并 编写 从 标准 输入 中 读 取 
数据 的 程序 。 这 种 方法 的 第 一 步 是 定义 一 个 输入 格式 ( input format)， 我 们 可 以 用 它 来 构造 
输入 文件 中 的 信息 。 我 们 可 以 自由 定义 任何 方便 的 输入 格式 。 

在 本 书后 面 ， 将 学 习 如 何在 Java 程序 中 读 取 网 页 (3.1 节 )， 并 将 名 称 转换 为 数字 ( 4.4 
节 ) 或 其 他 有 效 的 图 处 理 技术 。 现 在 ,我们 假设 有 n 个 网 页 ， 编 号 从 0 到 二 1， 并 且 我 们 用 
有 序 的 数字 对 来 表示 链接 ， 如 一 个 有 序数 字 对 ( a,b)， 是 指 a 中 包含 指向 5 的 链接 。 根据 这 
些 约定 ， 随 机 冲浪 问题 的 一 个 简单 的 输入 格式 是 由 一 个 整数 (n 的 值 ) 后 跟 一 串 整数 对 ( 表 
示 所 有 的 链接 ) 组 成 的 输入 流 。StdIn 将 所 有 的 空白 字符 序列 视 为 一 个 单独 的 分 隔 符 ， 因 此 
我 们 可 以 自由 地 在 每 行 放 一 个 或 多 个 链接 。 

转移 矩阵 “我们 使 用 一 个 二 维和 矩阵 来 完整 地 指定 随机 站 
冲浪 者 的 行为 ， 并 称 之 为 转移 矩阵 ( transition matrix)。 在 @ (3) 
个 网 页 中 ， 我 们 定义 一 个 aXn 的 矩阵 ， 这 样 第 1 行 第 /| nt 


J 

3 14 
列 的 值 就 是 随机 冲浪 者 从 网 页 i 跳 转 到 网 页 j 的 概率 。 我 和 
们 的 第 一 个 任务 是 编写 一 段 代码 ， 用 于 为 任何 给 定 的 输入 名 一 中 30 Ng 
创建 这 样 一 个 矩阵。 按照 90-10 的 规则 ， 这 个 计算 并 不 困 
难 。 我 们 按照 如 下 三 个 步骤 来 计算 : 随机 冲浪 模型 的 输入 格式 


。 读 取 n， 然 后 创建 数组 counts [ ][ ] 和 outDegrees[ ] 。 

。 读 取 链 接 并 逐渐 增加 计数 ，counts[ 可 [统计 从 i 到 j 的 链接 数 ，outDegrees[ 统计 从 i 

链接 到 的 网 页 的 总 数 。 

。 使 用 90-10 规则 来 计算 概率 。 

前 两 个 是 基本 的 步骤 ， 第 三 个 步骤 也 不 难 : 如 果 存 在 从 i 到 j 的 链接 ， 则 用 counts[ 引 四 
乘 以 0.90/outDegree[i] 《以 0.9 的 概率 取 随 机 链接 )， 然 后 每 个 元 素 加 0.10/n (以 0.1 的 概率 进 
入 随机 网 页 )。Transition (程序 1.6.1 ) 实现 了 上 述 功能 ， 它 是 一 个 从 标准 输入 读 取 图 并 将 相 
关 转 移 和 矩阵 打 印 到 标准 输出 的 过 滤器 。 

转移 矩阵 中 所 有 的 元 素 都 是 正 数 ， 因 为 每 一 行 表示 一 个 离散 的 概率 分 布 (discrete 
probability distribution) 一 一 矩阵 元 素 完全 堵 括 了 随机 冲浪 者 下 一 步 的 所 有 行为 ， 给 出 每 个 
网 页 被 访问 的 概率 。 特 别 要 注意 的 是 ， 元 素 总 和 为 1 (冲浪 者 总 是 要 去 某 个 网 页 )。 

Transition 的 输出 定义 了 另 一 种 文件 格式 ， 可 以 用 于 描述 矩阵 的 内 容 : 首先 输出 行 数 和 
列 数 ， 然 后 按照 行 主 映射 的 顺序 排列 逐个 输出 矩阵 中 的 值 ( 即 从 和 矩阵 的 左上 角 开 始 ， 逐 行 的 


编程 元 鞭 103 


从 左 到 右 输出 一 一 译 者 注 )。 现 在 ,我 们 可 以 编写 并 运行 一 个 转移 和 矩阵 的 程序 。 


链接 计数 出 度 
OT OO 
9 .0 32 扫 3 裔 5 
人 0 1 
TO 0 PH 0 1 
人 2 





转移 矩阵 的 计算 172 



















程序 1.6.1 ”计算 转移 矩阵 





public class Transition 


n 网 页 数量 


public static void main(String[] args) 


从 网 页 i 到 网 页 
counts[i][j] | . 
int n = StdIn.readIntO); * j 的 链接 数 


int[][] counts = new int[n][n]; .| 从 网 页 到 任何 

int[] outDegrees = new int[n]; outDegreesfi] 网 页 的 链接 数 

while (!StdIn.isEmpty()) 

{ // 失 加 链接 数量 2 
int i = StdIn.readInt(O); 
int j = StdIn.readIntO; 
outDegrees[i]++; 
counts[i] [j]++; 





} 


StdOut.printin(n + " " + nN); 
for (Cint i = 0; i < ni i++) 
{ // 打印 第 i 行 的 概率 分 布 
for (int j = 0; j < n; j++) 
{ // 打印 第 i 行 第 j 列 的 福 率 
double p = 0.9*counts[i][j]/outDegrees[i] + 0.1/n; 
StdOut,.printf("%8.5f", p); 
















} 
StdOut.print1nO; 


该 程序 是 一 个 从 标准 输入 中 读 取 链接 ， 并 在 标准 输出 上 生成 相应 转移 
矩阵 的 过 滤器 。 首 先 它 处 理 输入 以 计算 每 个 网 页 的 出 度 。 然 后 它 应 用 90:10 
规则 来 计算 转移 矩阵 〈 参 见 本 书 中 的 原理 描述 ) 。 它 假设 在 答 入 中 没有 出 
度 为 0 的 网 页 ( 参见 练习 1.6.3 ) 。 













% java Transition < tinyG.txt 
5 "5 

0.02000 0.92000 0.02000 0.02000 0.02000 
0.02000 0.02000 0.38000 0.38000 0.20000 
0.02000 0.02000 0.02000 0.92000 0.02000 
0.92000 0.02000 0.02000 0.02000 0.02000 
0.47000 0.02000 0.47000 0.02000 0.02000 


模拟 ”给 定 转移 矩阵 ， 模 拟 随机 冲浪 者 行为 涉及 的 代码 非常 少 ， 正 如 你 在 RandomSurfer 
(程序 1.6.2 ) 中 看 到 的 那样 。 该 程序 根据 规则 从 标准 输入 读 取 转移 矩阵 ， 并 按照 规则 链接 ， 


从 第 0 页 开始 ， 以 跳 转 次 数 作为 命令 行 参 数 。 它 统计 冲浪 者 访问 每 个 网 页 的 次 数 ， 除 以 跳 转 
范围 内 的 网 页 数量 ， 即 可 得 出 随机 冲浪 者 在 网 页 上 出 现 的 概率 的 估计 值 。 这 个 概率 被 称 为 网 
页 的 等 级 (rank)。 换 句 话 说 ，RandomSurfer 计算 所 有 网 页 等 级 的 估计 值 。 

一 次 随机 跳 转 。 计 算 的 关键 是 随机 跳 转 ， 这 是 由 转移 矩阵 指定 的 :> 我们 指定 一 个 变量 
page， 它 的 值 是 冲浪 者 的 当前 位 置 。 这 时 ， 转 移 和 矩阵 的 第 page 行 的 第 7 列表 示 的 就 是 冲浪 
者 下 一 步 到 网 页 7 的 概率 。 换 名 话说 ， 当 冲浪 者 在 page 上 时 ， 我 们 的 任务 是 根据 转移 矩阵 
中 的 第 page 行 给 出 的 分 布 ， 生 成 0 到 n-1 之 间 的 随机 整数 。 怎 样 才 能 完成 这 个 任务 呢 ? 我 
们 使 用 一 种 称 为 轮 盘 赌 选 择 (roulettewheel selection) 的 技术 。 我 们 使 用 Math.random() 生成 
一 个 0 到 1 之 间 的 随机 数 x, 但 是 它 如 何 帮 助 我 们 进入 一 个 随机 网 页 呢 ? 解 决 这 个 问题 的 一 
种 方法 是 将 第 page 行 中 的 概率 视 为 (0,1) 中 的 ww 个 区 间 的 集合 ， 其 中 每 个 概率 对 应 一 个 区 
间 长 度 。 然 后 我 们 的 随机 变量 x 落 入 其 中 一 个 区 间 ， 其 概率 由 区 间 长 度 精 确 指定 。 根 据 这 个 
推理 得 到 下 面 的 代码 : 

double sum = 0.0; 

for (Cint j = 0; j < n; j++) 

{ // 查找 包 合 r 的 区 间 

sum += p[page] [j]; 
if (r < sum) { page = j; break; } 

} 

变量 sum 追踪 行 page 中 定义 的 间隔 的 端点 ，for 循环 用 于 查找 包含 随机 值 z 的 间隔 。 例 
如 ， 假 设 冲 浪 者 在 我 们 例子 中 的 网 页 4。 转 移 概率 为 0.47、0.02、0.47、0.02 和 0.02，sum 
取 值 为 0.0、0.47、0.49、0.96、0.98 和 1.0。 这 些 值 表明 概率 定义 了 五 个 区 间 (0,0.47)、 
(0.47,0.49 )、( 0.49,0.96 )、( 0.96,0.98 ) 和 ( 0.98,1 )， 每 个 网 页 一 个 区 间 。 现 在 ， 假 设 Math. 
random() 返回 值 是 0.71， 我 们 将 7 从 0 增加 到 1 再 


到 2 并 停 在 那里 ， 而 0.71 在 间隔 (0.49.0.96 ) 中 ， 到 i jp 
所 以 我 们 把 冲浪 者 发 送 到 网 页 2。 然后， 我 们 开始 pe .47 .49 .96 .98 1.0 


在 网 页 2 执行 相同 的 计算 ， 随 机 冲浪 结束 并 开始 下 Edi 
一 次 冲浪 。 对 于 nn 较 大 的 情况 ,我 们 可 以 使 用 二 分 | 
搜索 (binary search) 来 大 幅 加 速 这 个 计算 ( 见 练习 1 /A\ 东信 
4.2.38 )。 在 这 种 情况 下 ， 我 们 愿意 花 更 多 的 时 间 和 9-0 0.47 0.49 ， 0.96 0.98 1.0 
精力 来 优化 算法 以 加 快 搜索 速度 ， 因 为 我 们 可 能 需 按照 离散 分 布 随机 生成 一 个 整数 
要 大 量 的 随机 跳 转 才能 完成 模拟 工作 。 

马尔 可 夫 链 。 描 述 冲浪 者 行为 的 随机 过 程 被 称 为 马尔 可 夫 链 ， 以 俄罗斯 数学 家 安 德 
烈 . 马尔 可 夫 ( Andrey Markov) 的 名 字 命名 ， 他 在 20 世纪 初 就 提出 了 这 个 概念 。 马 尔 可 夫 
链 能 够 广泛 地 适用 于 各 类 问题 ， 因 此 得 到 了 深入 研究 ， 它 有 许多 优秀 以 及 有 用 的 性 质 。 例 
如 ,你 可 能 想 知道 为 什么 RandomSurfer 是 从 网 页 0 开始 一 一 而 非 随机 选择 。 马 尔 可 夫 链 的 
一 个 基本 的 极限 定理 指出 ， 冲 浪 者 可 以 从 任何 地 方 开始 ， 因 为 无 论 随机 冲浪 者 从 何 位 置 开 
始 ， 最 终结 束 在 任何 特定 页 面 上 的 概率 是 相同 的 ! 无 论 冲浪 者 从 哪里 开始 ， 这 个 过 程 最 终 都 
会 稳定 到 一 点 ， 并 且 不 会 为 下 一 次 冲浪 提供 任何 信息 ， 这 种 现象 被 称 为 混合 (mixing )。 虽 然 
这 个 现象 第 一 感觉 可 能 是 违反 直觉 的 ， 但 它 解释 了 在 一 个 看 似 混乱 的 局 面 中 的 行为 一 致 性 。 
在 我 们 这 个 例子 中 表现 为 ， 经 过 足够 长 时 间 的 冲浪 后 ， 网 络 对 于 所 有 人 来 说 看 起 来 都 是 一 样 
的 。 但是， 并 不 是 所 有 的 马尔 可 夫 链 都 具有 这 种 混合 属性 。 例 如 ， 如 果 我 们 消除 了 模型 中 的 
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随机 跳 转 ,网 页 的 某 些 配置 会 给 冲浪 者 带 来 问题 。 事 实 上 ， 在 网 页 上 存在 一 组 被 称 为 奖 蛛 陶 
阱 (spider traps) 的 网 页 ， 其 目的 是 吸引 进入 的 链接 ,但 没有 出 去 的 链接 。 没 有 了 随机 跳 转 ， 
冲浪 者 就 会 被 困 在 一 个 蜂 蛛 陷阱 网 页 中 。90-10 规则 的 主要 目的 是 保证 混合 并 消除 这 种 异常 。 







模拟 一 个 随机 冲浪 者 


public class RandomSurfer 
{ 


程序 1:6.2 






























trials 跳 转 次 数 
public static void main(String[] args) 
/7 模拟 随机 冲浪 . n 网 页 数量 
int trials = Integer.parseInt(args[0]); 总 六 
int n = StdIn.readIntO); page “| 当前 页 


全 和 冲浪 者 从 第 页 

// 读 取 转移 矩 p[i][j] | 跳 转 到 第 j 页 的 

double[][] p = 和 double[n] [n] ; 概率 

for (int i = 0; i <n; i 内 冲浪 者 点 ; 
for (Cint j ='0; 相去 freq[i] 这 这 和 信和 


p[i][j] = 和 和 


int page = 0; 
int[] 和 = rie 
for (int ; t < trials; t++) 
{ 1 限 机 焉 畦 到 下 一 网 页 
double r = Math. ee 
double sum = 0.0 
for (int j = 0; j++) 
{i 容 找 他 全 的 区 同 
sum += p[page] [j]; 
if Cr < sum) { page = j; break; } 





} 
freq[page]++; 





} 
for (int 1 = 0; i < n; i++) // 打印 网 页 排名 
StdOut.printf("%8.5f", (double) freq[i] / trials); 
StdOut.print1nQ); 
} 


该 程序 使 用 转移 矩阵 来 模拟 随机 冲浪 者 的 行为 。 它 将 跳 转 次 数 作为 
一 个 命令 行 参数 ; 读 取 转 移 矩 阵 ， 按 照 矩阵 的 规定 执行 指定 的 跳 转 次 数 ， 
并 打印 每 个 网 页 的 相对 频率 。 计 算 的 关键 是 随机 跳 转 到 下 一 页 ( 见 原文 )。 












% java Transition < tinyG.txt | java RandomSurfer 100 
0.24000 0.23000 0.16000 0.25000 0.12000 

% java Transition < tinyG.txt | java RandomSurfer 1000000 
0.27324 0.26568 0.14581 0.24737 0.06790 





网 页 排名 。RandomSurfer 模拟 非常 简单 : 它 按 指定 的 跳 转 次 数 循环 ， 通 过 图 随机 地 冲浪 。 
由 于 混合 现象 ， 增 加 迭代 次 数 可 以 更 准确 地 估计 冲浪 者 访问 每 个 页 面 的 概率 (页 面 排 名 )。 
当 你 初次 思考 这 个 问题 时 ， 结 果 与 你 的 直觉 相 比 如 何 ? 你 可 能 已 经 猜 到 ， 网 页 4 是 排名 最 低 
的 网 页 但 是 你 认为 网 页 0 和 网 页 1 的 排名 会 高 于 网 页 3 吗 ? 如 果 我 们 想 知 道 哪 个 网 页 的 排 
名 是 最 高 的 ， 我们 需要 更 高 的 精度 和 更 高 的 准确 性 。RandomSurfer 需要 10" 次 跳 转 才能 得 到 
精确 到 个 小 数位 的 答案 ， 并 且 为 了 使 这 些 答案 稳定 到 一 个 精确 值 ， 还 需要 更 多 的 跳 转 。 就 
我 们 的 例子 而 言 ， 需 要 数 万 次 迭代 才能 得 到 精确 到 小 数 点 后 两 位 的 答案 ,并且 要 有 数 百 万 次 
的 迭代 才能 得 到 精确 到 小 数 点 后 三 位 的 答案 ( 见 练习 1.6.5 )。 最 终 的 结果 是 网 页 0 以 27.3% 
的 概率 击败 了 26.6% 概率 的 网 页 1。 如 此 小 的 差异 会 出 现在 这 个 问题 上 是 相当 令 人 惊讶 的 : 
如 果 你 猜 到 了 网 页 0 是 冲浪 者 最 有 可 能 去 的 地 方 ， 你 可 真 幸运 ! 
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准确 的 网 页 排名 估计 实际 上 是 有 价值 的 ， 原 因 有 很 多 。 首 先 ， 与 以 前 的 方法 相 比 ， 使 用 
它们 来 排列 符合 网 络 搜索 的 结果 得 到 的 网 页 会 更 符合 人 们 的 期 望 。 
其 次 ， 这 种 置信 度 和 可 靠 性 的 衡量 标准 为 基于 页 面 排 名 的 网 络 广 
告 带 来 了 大 量 的 投资 。 即 使 在 我 们 这 个 微小 的 例子 中 ， 页 面 排 名 
也 可 以 用 来 说 服 广告 客户 为 网 页 0 支付 比 网 页 4 多 四 倍 的 广告 费 。 
计算 页 面 排名 在 数学 上 是 合理 的 ， 它 是 一 个 有 趣 的 计算 机 科学 问 
题 、 一 个 大 型 的 商业 问题 ， 在 这 里 全 部 融合 成 一 个 问题 。 

了 四 





利用 直方 图 实现 可 视 化 。 使 用 StdDraw 创建 可 视 化 的 表意 模 
型 也 很 容易 ， 它 可 以 让 你 感觉 到 随机 冲浪 的 访问 频率 如 何 聚 合成 
页 面 排 名 。 如 果 你 启用 双 缓 冲 ; 适当 地 缩放 x 坐标 和 yy 坐标; 添 ”用 直方 图 表示 的 网 页 排名 
加 以 下 代码 : 

StdDraw.clear(); 

for (int 1 =10; 1 < ni 1++) 

StdDraw.filledRectangle(i, freq[i]/2.0, 0.25, freq[i]/2.0); 

StdDraw. showO); 

StdDraw.pause(10); 

到 随机 跳 转 循 环 ; 并 运行 RandomSurfer 进行 大 量 的 试验 ， 你 会 看 到 一 个 最 终 稳定 的 页 面 排 
名 的 频率 直方 图 。 一 旦 使 用 过 这 个 工具 ， 每 当 要 学 习 一 个 新 的 模型 (可 能 需要 一 些小 的 调整 
来 处 理 更 大 的 模型 )， 你 会 发 现 都 要 用 到 它 。 

学 习 其 他 模型 。RandomSurfer 和 Transition 是 数据 驱动 程序 中 很 好 的 例子 。 你 可 以 通过 
创建 一 个 像 tiny.txt 这 样 的 文件 来 定义 图 ， 该 文件 以 整数 了 开始 ， 然 后 指定 0 到 -1 之 间 的 
整数 对 来 表示 页 面 之 间 的 链接 。 鼓 励 按 照 练 习 中 的 建议 运行 各 种 数据 模型 ， 或 者 制作 一 些 自 
己 的 链接 图 。 如 果 你 想 知 道 网 页 排名 是 如 何 工作 的 ， 那 么 这 些 计 算 能 够 帮助 你 更 好 地 理解 一 
个 网 页 的 排名 高 于 男 一 个 网 页 的 原因 。 哪 种 页 面 最 可 能 排名 更 高 ? 是 有 很 多 链接 的 网 页 ， 还 
是 只 有 很 少 链接 的 网 页 ?本 节 有 很 多 练习 人 研究 随机 冲浪 者 的 行为 。 既 然 RandomSurfer 使 用 
标准 输入 ， 你 也 可 以 编写 简单 的 程序 来 生成 大 规模 的 图 ， 通 过 Transition 和 RandomSurfer 
用 管道 连接 它们 的 输出 ， 这 样 就 可 以 研究 大 规模 图 上 的 随机 冲浪 。 这 种 灵活 性 是 使 用 标准 输 
入 和 标准 输出 的 重要 原因 。 

直接 模拟 一 个 随机 冲浪 者 的 行为 来 理解 网 络 结构 是 可 行 的 ， 但 是 它 有 局 限 性 。 想 想 以 下 
问题 : 你 可 以 使 用 它 来 计算 具有 数 百 万 (或 数 十 亿 ! ) 网 页 和 链接 的 网 络 图 的 网 页 排名 吗 ? 
我 们 很 快 就 可 以 给 出 否定 的 答案 ， 因 为 你 甚至 不 能 为 这 么 多 的 网 页 存储 转移 矩阵 。 数 百 万 网 
页 的 和 矩阵 将 有 数 万 亿 的 元 素 。 你 的 计算 机 上 有 这 么 多 空间 吗 ? 你 可 以 使 用 RandomSurfer 找 
到 一 个 较 小 的 图 的 网 页 排名 吗 ? 比如 有 几 千 个 网 页 。 要 回答 这 个 问题 ， 你 可 以 进行 多 次 模 
拟 ， 记 录 大 量 试验 的 结果 ， 然 后 解释 这 些 实验 结果 。 我 们 确实 使 用 这 种 方法 解决 了 许多 科学 
问题 ( 赌 徒 破产 问题 就 是 一 个 例子 ，2.4 节 将 讨论 另外 一 个 问题 但 这 样 做 会 非常 耗 时 ， 因 
为 需要 进行 大 量 的 试验 来 获得 所 需 的 准确 性 。 即 使 对 于 我 们 这 个 小 例子 ， 我 们 也 看 到 需要 数 
百 万 次 迭代 才能 将 页 面 排名 精确 到 小 数 点 后 三 位 或 四 位 。 对 于 更 大 的 图 ， 获 得 准确 估计 所 需 
的 迭代 次 数 将 变 得 非常 巨大 。 

混合 马尔 可 夫 链 ”页 面 排名 是 转移 矩阵 的 一 个 属性 ， 而 不 是 将 转移 矩阵 作为 计算 它们 的 
特定 方法 ， 记 住 这 一 点 非常 重要 ， 换 句 话说 ，RandomSurfer 只 是 一 种 计算 页 面 排名 的 方法 。 
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幸运 的 是 ， 基 于 数学 研究 领域 的 简单 计算 模型 提供 了 比 模拟 计算 页 面 排名 更 有 效 的 方法 。 该 
模型 利用 了 我 们 在 1.4 节 中 研究 过 的 二 维 矩 阵 的 基本 算术 运算 。 

马尔 可 夫 链 的 平方 。 随 机 冲浪 者 通过 两 次 跳 转 从 第 i 页 跳 转 到 第 j 页 的 概率 是 多 少 ? 第 
一 步 跳 转 到 一 个 中 间 网 页 k， 所 以 我 们 计算 从 i 到,- 然后 从 可 能 的 到 j 的 概率 ， 并 把 所 有 
概率 相 加 。 对 于 我 们 的 例子 ,通过 两 次 跳 转 从 1 跳 转 到 2 的 概率 是 从 1 一 0 一 2 的 概率 
(0.02X0.02) 加 上 从 1 一 1 一 2( 0.02 x0.38 ) 的 概率 ， 加 上 从 1 一 2 一 2( 0.38X0.02 ) 的 概率 ， 
加 上 从 1 一 3 一 2 (0.38X0.02)， 再 加 上 从 1 一 4 一 2 的 概率 (0.20X0.47 )， 总 和 为 0.1172。 
每 一 对 页 面 都 有 相同 的 计算 过 程 。 这 个 计算 是 我 们 以 
前 见 过 的 ， 在 和 矩阵 乘法 的 定义 中 : 结果 中 行列 j 中 
的 元 素 是 原始 行 i 和 列 j 的 点 积 。 换 句 话 说 ,将 p[][] 
乘 以 自身 的 结果 是 一 个 和 矩阵， 其 中 第 i 行 第 j 列 中 的 ye 
元 素 是 随机 冲浪 者 通过 两 次 跳 转 从 第 i 页 跳 转 到 第 j Pp -一 浪 概率 
页 的 概率 。 对 于 我 们 的 例子 ， 研 究 两 次 跳 转 转移 矩阵 2 





的 元 素 是 非常 值得 你 花费 时 间 的 ， 并 且 会 帮助 你 更 好 
地 理解 随机 冲浪 者 的 动作 。 例 如 ， 和 矩阵 中 的 最 大 值 浪 概率 





是 第 2 行 第 0 列 中 的 值 ， 反 映 了 从 网 页 2 开始 的 冲 
浪 者 只 有 一 个 到 网 页 3 的 链接 ， 在 网 页 3 只 有 一 个 人 
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到 网 页 0 的 链接 。 因 此 ， 到 目前 为 止 ， 从 第 2 页 开 .45 .04 [121.37 .02 。 通过 两 次 胱 转 
始 的 冲浪 者 最 有 可 能 的 结果 是 在 两 次 跳 转 之 后 在 网 .86 :04 .04 .05 02 -从 1 跳 转 到 2 的 冲 


浪 概率 ( 点 积 
页 0 结束。 所 有 其 他 两 次 跳 转 路 线 涉 及 其 他 选择 的 DA 了 ) 
可 能 性 较 小 。 重 要 的 是 要 注意 这 是 一 个 精确 的 计算 .05 .44 .04 .45 .02 
平方 马尔 可 夫 链 


( 仅 受 到 Java 浮 点 精度 的 限制 ); 相反 ，RandomSurfer 

仅 能 产生 一 个 估计 值 ， 需 要 更 多 的 迭代 来 获得 更 准确 的 估计 值 。 
界 乘 方法 。 我 们 可 以 再 次 乘 以 p[][] 来 计算 三 次 跳 转 的 概率 ， 再 乘 以 p[][] 计算 四 次 跳 

转 的 概率 ， 以 此 类 推 。 但 是 ， 和 矩阵 和 和 矩 阵 相 乘 的 代价 是 昂贵 的 ， 我们 实际 上 需要 的 是 向 量 

(vector) 和 和 矩阵 相 乘 ， 对 于 我 们 的 例子 ， 我 们 从 向 量 


[1.0 0.0 0.0 0.0 0.0] 


开始 ， 它 指定 随机 冲浪 者 从 网 页 0 开始 。 将 这 个 向 量 与 转移 矩阵 相 乘 得 到 向 量 
[.02=:92 :02 92 .029 

这 是 一 次 跳 转 后 冲浪 者 在 每 个 网 页 上 结束 的 概率 。 现 在 ， 将 这 个 向 量 乘 以 转移 矩阵 得 到 向 量 
1.05 04736 .37 :194 


该 向 量 包含 了 两 次 跳 转 后 冲浪 者 在 每 个 页 面 上 结束 的 概率 。 例 如 ， 两 次 跳 转 从 0 跳 转 到 2 的 
概率 是 从 0 跳 转 到 0 到 2 (0.02X0.02 ) 的 概率 加 上 从 0 跳 转 到 1 到 2 的 概率 (0.92X0.38)， 
加 上 从 0 到 2 到 2 (0.02X0.02 ) 的 概率 ,加 上 从 0 到 3 到 2 (0.02X0.02 ) 的 概率 ， 再 加 上 
从 0 到 4 到 2 的 概率 (0.02X0:47 )， 总 和 为 0.36。 在 这 些 初 始 计算 中 ， 模 式 是 清晰 的 : 给 
出 随机 冲浪 者 通过 1 次 跳 转 之 后 在 每 个 页 面 的 概率 的 向 量 恰好 是 夺 ] 次 跳 转 对 应 向 量 与 转移 
矩阵 的 乘积 。 根 据 马尔 可 夫 链 的 基本 极限 定理 ， 无 论 我 们 从 哪里 开始 ， 这 个 过 程 都 收敛 到 
相同 的 向 量 ; 换 句 话说 ， 在 足够 次 的 跳 转 之 后 ， 冲 浪 者 在 任何 给 定 页 面 上 结束 的 概率 与 起 点 
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无 关 。Markov (程序 1.6.3 ) 可 以 用 来 检查 我 们 的 计算 方法 是 不 是 与 原来 的 设计 一 致 。 例 如 ， 
它 能 够 获得 与 RandomSurfer 相同 的 结果 (网 页 排名 精确 到 小 数 点 后 两 位 )， 但 只 有 20 次 拢 
阵 -向 量 乘法 运算 ， 而 不 是 RandomSurfer 所 需 的 数 万 次 迭代 。 另 外 20 次 乘法 运算 给 出 的 结 
果 可 精确 到 小 数 点 后 三 位 ， 而 RandomSurfer 的 数 百 次 迭代 也 只 有 少 部 分 给 出 了 完全 精确 的 
结果 ( 见 练习 1.6.6 )。 


ranks[] p[][] newRanks[] 
第 1 次 跳 转 9 "02 .02 -0 
.02 .38 .38 .20 
E00 0 00007 is O02 302 .923502l = I 请 i 2 ] 
.02 .02 .02 .02 通过 一 次 跳 转 
OR :47 a0 :02 从 0 到 的 冲浪 概率 
第 2 次 跳 转 通过 一 次 跳 转 
Sy 从 i 到 2 的 冲浪 概率 
通过 一 次 跳 转 i ; 
从 0 到 i 的 冲浪 概率 .02 .02 te 
RS .38 .20 





[|:02 -292 -02 :02 -02|] * |. ‘92 .02| = [0 .05 w 因 | 37 .19 ] 


.02 .02 Ww \ fa 








.02 .02 
第 3 次 跳 转 从 0 到 i 的 冲浪 概率 
通过 两 次 跳 转 
从 0 到 i 的 冲浪 概率 :92 .02 .02 .02 
ry 02. 3.338 20 


DOS S04 WIH EB SL] “| 102. .02 .92 .02| = [ .44 :06 .12 .36 .03-] 


02 ,02 102502 
WR ,02 通过 三 次 跳 转 
从 0 到 i 的 冲浪 概率 





第 20 次 跳 转 

通过 19 次 跳 转 

从 0 到 i 的 冲浪 概率 .92 .02 .02 .02 

pl =\ -02 138 .38 .20 

.2715260515 朴 29900 六 起 0200200023192 79217 [E27 好 和 . 册 5 中 37 说 
.02 .02 .02 .02 a 
通过 2 

人 从 0 到 的 冲浪 概率 





(稳定 状态 ) 
计算 网 页 排名 的 蝴 乘 方法 (转移 概率 的 极限 值 ) 


马尔 可 夫 链 是 经 过 精心 研究 的 ， 但 直到 1998 年 ， 它 对 网 络 的 影响 才 引 起 人 们 的 关注 ， 
当时 两 名 研究 生 一 一 谢 尔 盖 … 布 林 ( Sergey Brin) 和 劳伦斯 佩 奇 (Lawrence Page) 一 一 大 
胆 尝 试 通过 建立 马尔 可 夫 链 来 计算 随机 冲浪 者 点 击 整 个 网 络 (the whole web) 的 网 页 概率 。 
它们 的 工作 彻底 改变 了 网 络 搜索 的 方式 ， 这 也 是 非常 成 功 的 网 络 搜索 公司 Google 使 用 的 网 
页 排名 方法 的 基础 。 具 体 而 言 ， 它 们 的 想法 是 向 用 户 呈 现 与 它们 的 搜索 查询 相关 的 网 页 列 
表 ， 并 根据 网 页 排名 降序 排列 。 网 页 排名 (以 及 相关 技术 ) 现在 占 主导 地 位 ， 因 为 在 典型 的 
搜索 中 ,与 早期 的 技术 (如 按 进入 链接 的 数量 排序 网 页 ) 相 比 ， 它 们 为 用 户 提 供 了 与 搜索 内 
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容 更 相关 的 网 页 。 由 于 网 页 数量 庞大 ， 计 算 网 页 排名 是 一 项 非常 耗 时 的 工作 ， 但 它 能 带 来 巨 
大 的 效益 ， 时 间 开 销 非 常 值得 。 



























程序 1.6.3 ”混合 马尔 可 夫 链 








public class Markov 


{ /WN 在 测试 跳 转 之 后 计算 网 页 排名 trials 跳 转 次 数 


ublic static void main(Strin args 
9 (CString[] args) iS 网 页 数量 


int trials = Integer.parseInt(args[0]); p[j[] 转移 矩阵 
int n = StdIn.readInt(); 二 
StdIn.readInt(0); es 网 页 排名 


// 读 取 转移 newRanks[] 新 的 网 页 排名 


矩阵 
double[][] p = new double[n] [n]; 
for (int i = 0; < nN; A 
for (int j = 0; j < j++) 
p[i][j] = StdIn. DR bs 


// 使 用 其 乘 方法 来 计算 网 页 排名 
double[] ranks = new double[n]; 
ranks[0] = 1. 
for (int t = 0; < trials; t++ 
1 /中 条 下 “次 哎 轩 对 网 咒 拓 名 的 影响 
double[] newRanks = new on 
1 /网 风 1 的 新 扫 到 是 pL 的 
yg Rot 
人 /第 1 列 汪 之 之 前 排名 
dl (int k = 0; k 3 二 十) 
newRanks[j] += 下 
} 


for (int j = 0; j-<n; j++) YA/ 更 新 排名 
ranks[j] = newRanks[j]; 





for (int i = 0; i < ni i++) 4 下 序 风 页 排 
StdOut.printf("%8.5f", ranks[i] 
Stdout .println0) ; 





这 个 程序 从 标准 输入 中 读 取 一 个 转移 矩阵 ， 并 计算 一 个 随机 冲浪 者 在 
命令 行 参 数 中 给 定 的 步骤 数 之 后 访问 每 个 网 页 的 概率 〈 网 页 排名 ) 。 


% java Transition < tinyG.txt | java Markov 20 
0.27245 0.26515 0.14669 0.24764 0.06806 

% java Transition < tinyG.txt | java Markov 40 
0.27303 0.26573 0.14618 0.24723 0.06783 


收获 对 随机 冲浪 模型 的 全 面 理解 超出 了 本 书 的 范围 。 我 们 的 目的 是 向 你 展示 一 个 应 
用 , 其 中 包括 写 一 个 较 长 的 程序 并 用 这 个 程序 来 讲解 特定 的 概念 。 我 们 可 以 从 这 个 案例 研究 
中 学 到 哪些 具体 的 收获 呢 ? 

我 们 已 经 有 了 一 个 完整 的 计算 模型 。 数 据 和 字符 串 等 基本 类 型 、 条 件 和 循环 、 数 组 和 
标准 输入 /输出 /绘图 /音频 使 你 能 够 解决 各 种 有 趣 的 问题 。 事 实 上 ， 按 照 理 论 计 算 机 科 
学 的 基本 原理 ， 这 个 模型 足够 在 任何 适当 的 计算 设备 上 解决 任何 计算 问题 。 在 接 下 来 的 
两 章 中 ,我 们 讨论 扩展 模型 的 两 个 关键 方法 以 大 幅 减 少 开发 大 型 复杂 程序 所 需 的 时 间 和 
精力 。 

数据 驱动 的 代码 将 会 大 量 出 现 。 使 用 标准 输入 输出 流 将 数据 保存 在 文件 中 是 一 个 重要 的 
概念 。 我 们 编写 了 从 一 种 输入 转换 为 另 一 种 输入 的 过 滤器 ， 能 够 产生 用 于 研究 的 大 型 输入 文 
件 的 生成 器 ， 以 及 可 以 处 理 多 种 模型 的 程序 。 我 们 可 以 保存 数据 以 便当 前 或 后 续 使 用 。 我 们 
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还 可 以 处 理 来 自 其 他 来 源 的 数据 ,然后 将 其 保存 在 一 个 文件 中 ， 而 无 论 它 是 来 自 科学 仪器 还 
是 来 自 远程 的 网 站 。 数 据 驱动 代码 概念 以 一 种 简单 而 灵活 的 方式 来 支持 这 套 活动 。 
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184 大 规模 示例 的 网 页 排名 直方 图 


准确 性 不 能 保证 。 仅 仅 根据 程序 产生 的 结果 能 精确 到 小 数 点 后 很 多 位 就 认为 结果 准确 是 
错误 的 。 通 常 我 们 面临 的 最 棘手 的 挑战 是 确保 我 们 有 精确 的 答案 。 

通用 的 随机 数字 生成 方法 只 是 一 个 开始 。 当 我 们 通俗 地 谈论 随机 行为 时 ， 我 们 经 常 想到 
的 是 一 些 比 Math.random() 给 我 们 的 “每 一 个 取 值 的 可 能 性 相等 ”更 复杂 的 模型 。 我 们 考虑 
的 许多 问题 涉及 使 用 服从 某 些 特定 分 布 的 随机 数字 (如 RandomSurfer)。 

效率 问题 。 育 目地 认为 你 的 计算 机 速度 非常 快 ， 能 够 进行 任何 计算 也 是 错误 的 。 可 能 某 
些 问题 需要 更 多 的 计算 工作 量 。 例 如 ，Markov 中 使 用 的 方法 比 直接 模拟 随机 冲浪 者 的 行为 
更 有 效率 ， 但 是 对 于 实际 出 现 的 巨大 的 Web 图 来 说 ， 其 计算 网 页 排名 的 速度 仍然 太 慢 。 第 4 
章 专门 讨论 如 何 评估 你 编写 的 程序 的 性 能 。 在 此 之 前 ， 我 们 推迟 对 这 些 问 题 的 详细 研究 ， 但 
请 记 住 ， 你 始终 需要 对 你 的 程序 的 性 能 要 求 有 一 些 总 体 的 了 解 。 

或 许 我 们 要 学 习 的 最 重要 的 收获 是 : 编写 像 本 节 练 习 那 样 的 复杂 问题 的 程序 时 ， 调 试 程 


序 难度 很 高 。 本 书 中 精心 设计 的 程序 掩盖 了 这 一 收获 ， 每 一 个 程序 都 经 过 了 长 时 间 的 测试 ， 
不 断 地 修复 漏洞 ， 并 在 大 量 的 输入 中 运行 过 。 一 般 而 言 ， 我 们 在 本 书 的 讲解 中 尽量 避免 描述 
编程 错误 以 及 修改 过 程 ， 否 则 会 让 学 习 过 程 变 得 很 枯燥 ,或 让 你 的 注意 力 过 多 地 集中 在 错误 
代码 上 。 练 习 和 本 书 官网 中 有 一 些 错 误 代码 示例 和 修正 过 程 的 描述 。 


练习 


1.6.1 修改 Transition 将 跳 转 概 率 作 为 命令 行 参 数 ， 并 使 用 你 修改 的 版 本 计算 切换 到 80-20 规则 或 
95-5 规则 的 网 页 排名 效果 。 

1.6.2 ”修改 Transition 以 忽略 多 个 链接 的 影响 。 也 就 是 说 ， 如 果 从 一 个 网 页 到 男 一 个 网 页 有 多 个 链接 ， 
请 将 它们 计 为 一 个 链接 。 创 建 一 个 小 例子 ， 展 示 这 个 修改 如 何 改 变 网 页 排名 。 

1.6.3 修改 Transition 来 处 理 没有 跳出 链接 的 网 页 ， 把 这 些 网 页 在 转移 矩阵 中 对 应 的 一 行 全 部 设置 为 
1/n， 其 中 是 列 的 数量 。 

1.6.4 ” RandomSurfer 中 的 代码 段 产 生 随机 跳 转 时 如 果 行 p [page] 的 概率 加 起 来 不 等 于 1 则 失败 。 请 解 
释 在 这 种 情况 下 发 生 了 什么 ， 并 提出 解决 问题 的 方法 。 

1.6.5 ”尝试 估算 对 于 tiny.txt 文件 所 描述 的 图 ，RandomSurfer 计算 精确 到 小 数 点 后 4 位 和 小 数 点 后 5 
位 的 网 页 排名 所 需要 的 迭代 次 数 。 

1.6.6 ”判断 用 Markov 方法 计算 tiny.txt 精确 到 小 数 点 后 3 位 、 小 数 点 后 4 位 和 小 数 点 后 10 位 的 网 页 
排名 需要 的 迭代 次 数 。 

1.6.7 从 本 书 官网 下 载 文件 medium.txt (用 本 节 描 述 格式 保存 的 50 个 网 页 的 信息 )， 添 加 从 网 页 23 到 
其 他 每 一 个 网 页 的 链接 。 观 察 它 对 网 页 排名 的 影响 ， 并 讨论 结果 。 

1.6.8 ”向 medium.txt 添加 (请 参阅 前 面 的 练习 ) 从 其 他 每 一 个 网 页 到 网 页 23 的 链接 ， 观 察 它 对 网 页 排 
名 的 影响 ， 并 讨论 结果 。 

1.6.9 假设 你 的 网 页 是 在 medium.txt 中 的 网 页 23。 有 没有 一 个 从 你 的 网 页 到 其 他 网 页 的 链接 : 添加 这 
个 链接 后 可 以 提高 你 的 网 页 排名 ? 

1.6.10 假设 你 的 网 页 是 在 medium.txt 中 的 网 页 23。 有 没有 一 个 从 你 的 网 页 到 其 他 网 页 的 链接 : 添加 

这 个 链接 后 可 以 降低 你 的 网 页 排名 ? 
1.6.11 使 用 Transition 和 RandomSurfer 来 确定 下 面 展示 的 具有 8 个 网 页 


的 图 的 网 页 排名 。 
1.6.12 ”使 用 Transition 和 Markov 来 确定 下 面 展示 的 具有 8 个 网 页 的 图 的 @) 

网 页 排名 。 8 个 网 页 的 图 的 示例 
创新 练习 


1.6.13 短 阵 平方 。 编 写 一 个 像 Markov 这 样 的 程序 ， 通 过 重复 对 和 矩阵 进行 平方 来 计算 网 页 排名 ， 从 而 
计算 序列 p、p*?、p*、p*"、p" 等 。 验 证 矩阵 中 的 所 有 行 是 否 收敛 到 相同 的 值 。 

1.6.14 ”随机 网 络 。 为 Transition 创建 一 个 生成 器 ， 将 网 页 计数 n 和 链接 计数 m 作为 命令 行 参数 ， 并 向 
标准 输出 打印 n， 后 面 跟 随 m 个 取 值 范围 为 0 到 n-1 的 随机 整数 对 。( 关 于 更 真实 的 Web 模型 
的 讨论 ， 请 参阅 4.5 节 )。 

1.6.15 ”中心 网 页 与 发 散 网 页 。 向 上 一 个 练习 中 的 生成 器 添加 固定 数量 的 中 心 网 页 ， 即 随机 选取 的 
10% 网 页 有 链接 指向 这 些 中 心 网 页 ， 以 及 添加 固定 数量 的 发 散 网 页 ， 即 它们 有 指向 随机 选取 
的 10% 网 页 的 链接 。 计 算 网 页 排名 。 哪 个 排名 更 高 ， 中 心 网 页 还 是 发 散 网 页 ? 
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1.6.16 
1.6.17 


1.6.18 


R619 


EE 


网 页 排名 。 设 计 一 个 图 ， 其 中 指向 排名 最 高 的 网 页 的 链接 数 比 指向 其 他 网 页 的 链接 数 更 少 。 
点 击 次 数 。 一 个 网 页 的 点 击 次 数 是 指 随机 冲浪 者 访问 该 网 页 的 跳 转 次 数 。 运 行 实 验 来 估计 
tiny.txt 的 点 击 次 数 ， 将 点 击 次 数 与 网 页 排名 进行 比较 ,构想 一 个 关于 这 种 关系 的 假设 ,然后 
在 medium.txt 上 验证 你 的 假设 。 

履 盖 时 间 。 编 写 一 个 程序 ， 从 一 个 随机 的 网 页 开始 ， 估 计 随 机 冲浪 者 每 个 网 页 都 至 少 访问 一 
次 所 需 的 时 间 。 

图 形 模拟 。 创 建 一 个 图 形 模拟 网 页 排名 ， 其 中 代表 每 个 页 面 的 点 的 大 小 与 其 页 面 排名 成 比例 。 
为 了 使 你 的 程序 由 数据 驱动 ， 设 计 一 个 文件 格式 ， 其 中 包括 指定 每 个 网 页 应 绘制 的 位 置 的 坐 
标 。 在 medium.txt 上 测试 你 的 程序 。 


| 第 2 章 


Computer Science: An Interdisciplinary Approach 


明 数 和 模块 





本 章 重点 介绍 一 种 重要 的 代码 结构 : 函数 (function)。 与 条 件 和 循环 一 样 ， 函 数 对 控制 
流 具 有 深远 影响 ， 可 以 用 于 在 不 同 代码 段 之 间 来 回 传递 控制 。 函 数 (在 Java 中 称 为 静态 方 
法 ) 的 重要 性 不 言 而 喻 ， 因 为 它们 可 以 在 程序 中 明确 地 分 割 任 务 ， 而 且 其 提供 了 一 种 机 制 使 
我 们 能 够 重复 使 用 功能 类 似 的 代码 。 

我 们 将 函数 集中 在 可 以 独立 编译 的 模块 (module) 中 。 我 们 使 用 模块 将 计算 编程 任务 分 
解 成 合理 大 小 的 子 任务 。 你 将 在 本 章 中 学 习 如 何 构建 你 自己 的 模块 以 及 如 何 使 用 它们 ， 以 编 
程 的 风格 划分 ， 这 称 作 模 块 化 编程 (modular programming)。 

模块 被 建立 的 主要 目的 是 为 了 代码 复 用 ， 就 是 使 得 编写 出 的 代码 可 以 在 稍 后 的 许多 其 他 程 
序 中 再 次 使 用 。 我 们 将 这 些 模块 称 为 库 (library)。 在 本 章 中 , 尤其 重要 的 是 用 于 生成 随机 数 、 
分 析 数 据 以 及 为 数组 提供 输入 输出 的 库 。 库 的 使 用 极 大 地 扩展 了 程序 本 身 提供 的 基本 数据 操作 。 

将 控制 传递 给 函数 自身 的 过 程 称 为 递归 。 起 初 ， 递 归 可 能 看 起 来 违反 直觉 ,但 当 你 理解 
它 的 原理 后 ， 可 以 用 它 开 发 简单 的 程序 以 实现 复杂 的 任务 ， 而 这 些 复杂 的 任务 本 来 可 能 是 非常 
难于 实现 的 。 

在 编程 时 ， 要 尽 可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 任务 ， 然 后 分 别 实现 。 本 章 中 我 
们 会 不 断 地 强调 这 一 点 ;并 在 本 章 最 后 一 个 案例 中 展示 如 何 通 过 将 复杂 的 编程 任务 分 解 成 更 小 
的 子 任务 ， 然 后 独立 开发 以 实现 子 任务 ， 并 编写 彼此 交互 的 模块 ， 最 终 完 成 复杂 的 编程 任务 。 


2.1 函数 的 定义 


用 于 实现 函数 的 Java 结构 称 为 静态 方法 ( static method)。 形 容 词 static 是 为 了 将 这 种 方 
法 与 第 3 章 中 将 要 讨论 的 方法 区 分 开 一 一 我 们 从 现在 开始 将 一 直 使 用 “静态 ”这 个 形容 词 ， 
但 是 到 第 3 章 才 讨论 这 两 类 方法 的 差异 。 其 实 从 本 书 一 开始 ， 你 就 已 经 使 用 了 静态 方法 ， 从 
数学 函数 库 中 的 Math.abs() 和 Math.sqrt()， 到 StdIn、StdOut、StdDraw 和 StdAudio 中 的 所 
有 方法 。 事 实 上 ， 你 编写 的 每 个 Java 程序 都 有 一 个 名 为 main() 的 静态 方法 。 在 本 节 中 ， 你 
将 学 习 如 何 定义 自己 的 静态 方法 。 

在 数学 中 ， 函 数 的 作用 是 将 输入 值 (一 种 类 型 或 取 值 范围 ) 映射 到 输出 值 ( 男 一 种 类 型 
或 取 值 范围 )。 例 如 ， 函 数 fx)=x? 映射 2 到 4、3 到 9、4 到 16 等 。 首 先 ， 我 们 使 用 静态 方 
法 来 实现 一 些 数学 函数 ， 因 为 这 些 函 数 我 们 比较 熟悉 。Java 的 数学 库 中 实现 了 许多 标准 的 
数学 函数 ， 但 是 科学 家 和 工程 师 们 会 使 用 各 种 各 样 的 数学 函数 ， 这 些 函 数 不 会 全 部 包含 在 库 
中 。 在 本 节 的 开头 ， 你 将 学 习 如 何 自行 实现 这 些 函 数 。 

之 后 ， 你 将 了 解 到 ， 静 态 方 法 可 以 实现 的 远 不 止 数学 函数 的 功能 ， 例 如 ， 静 态 方 法 的 取 
值 范围 可 以 是 字符 串 或 其 他 类 型 ， 也 可 以 实现 如 打印 输出 等 副 功能 。 我 们 还 在 本 节 中 考虑 如 
何 使 用 静态 方法 组 织 程序 ， 从 而 简化 复杂 的 编程 任务 。 

静态 方法 支持 一 个 关键 概念 : 在 编程 时 ， 要 尽 可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 
任务 ， 然 后 分 别 实现 。 这 是 一 种 重要 的 编程 方法 ， 从 现在 开始 你 就 应 该 记 住 并 执行 。 我 们 将 
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会 在 本 节 中 不 断 地 强调 、 强 化 这 一 点 。 当 你 写 一 篇 文章 时 ， 你 将 其 分 解 成 段落 ; 当 你 编写 程 
序 时 ， 你 会 把 它 分 解 成 方法 。 在 编程 中 将 较 大 的 任务 分 成 较 小 的 任务 甚至 比 编写 代码 本 身 都 
要 重要 得 多 ， 因 为 它 大 大 方便 了 调试 (debugging)、 维 护 (maintenance) 和 复 用 (reuse)， 这 


些 都 是 开发 良好 软件 的 关键 。 


静态 方法 ”正如 你 从 使 用 Java 数学 库 所 知道 的 ， 静 态 方法 的 使 用 很 容易 理解 。 例 如 ， 
当 你 在 程序 中 编写 Math.abs(a-b) 时 ， 效 果 就 如 同 你 将 代码 替换 为 Java 的 Math.abs() 方法 的 
返回 值 ， 其 中 a-b 是 方法 的 参数 。 这 种 用 法 是 非常 直观 的 ， 我 们 几乎 不 需要 讨论 它 。 如 果 你 
想 知道 系统 怎样 实现 这 个 效果 ， 你 会 看 到 它 实际 上 改变 了 程序 的 控制 流 ( control flow)。 通 
过 这 种 方式 改变 控制 流 ， 与 通过 条 件 和 循环 改变 控制 流 是 同等 重要 的 。 


在 .java 文件 中 ,你 可 以 随意 为 你 的 静态 方法 命名 
(除了 main() 方法 以 外 )， 然 后 就 可 以 用 一 系列 语句 代码 实 
现 方法 的 具体 功能 。 我 们 稍 后 会 研究 细节 ， 在 这 里 我 们 
先 使 用 一 个 简单 的 例子 一 一 Harmonic (程序 2.1.1) 一 一 
说 明 函 数 如 何 影 响 控制 流 。 在 这 个 程序 中 有 一 个 名 为 
harmonic() 的 静态 方法 ， 需 要 输入 一 个 整数 参数 n， 并 返 
回 第 n 个 谐 波 数 (参见 程序 1.3.5 )。 

程序 2.1.1 优 于 我 们 原来 的 计算 谐 波 数 的 程序 (程序 
1.3.5)， 因 为 它 清楚 地 将 程序 分 为 了 两 个 主要 任务 : 计算 
谐 波 数 并 与 用 户 进 行 交 互 (为 了 说 明 ， 程 序 2.1.1 需要 几 个 
命令 行 参数 ， 测 不 是 只 有 一 个 )。 在 编程 时 ， 要 尽 可 能 地 
将 程序 明确 地 分 割 成 相互 独立 的 子 任务 ， 然 后 分 别 实现 。 






程序 2.1.1 谐 波 数 (二 ) 
public class Harmonic 


public static double harmonic(int n) 





double sum = 0.0; 

for (Cint i = 1 <= n; i++) 
sum += 1.0/i; 

return sum; 









public static void main(String[] args) 
for (int i = 0; i < args.length; i++) 
£ 
int arg = Integer.parseInt(args[i]); 
double value = harmonic(arg); 


StdOut.printin(value); 


和; 
+ 


命令 行 指定 的 整数 参数 来 调用 harmonic()。 







% java Harmonic 1 2 4 

1.0 2.9289682539682538 
1.5 5.187377517639621 
2.083333333333333 7.485470860550343 


9.787606036044348 


该 程序 定义 了 两 个 静态 方法 ， 一 个 名 为 harmonic()， 它 需要 输入 整数 
参数 n"， 并 计算 第 n 个 谐 波 数 ( 见 程序 1.3.5 )”， 另 一 个 命名 为 main()， 它 用 


% java Harmonic 10 100 1000 10000 






HY 
DA a i 
Tic st le harmonic(Cint n) 
double sum = 0.0; 
for (int 1 = 1; i <= Nn; i++) 
0/i; 


SUM += 
return sum; 


由 人 ic static void main(String[] args) 


六 for (int 1 = 0; i < args.length; i++) 5 
int arg = Integer.parseInt(args[i]); 电 
double value =(harmonic(arg); 


Stdout.println(Cvalue) ; 





调用 静态 方法 的 控制 流 









sum | 累计 总 和 





arg | 参数 






value | 返回 值 
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控制 流 。 既 然 Harmonic 程序 实现 的 是 一 个 我 们 熟悉 的 数学 函数 ， 那 么 我 们 就 可 以 仔细 
地 研究 它 的 代码 ， 以 便 仔 细 思 考 什 么 是 静态 方法 ， 以 及 静态 方法 的 运行 方式 。Harmonic 包 
含 两 个 静态 方法 : harmonic() 和 main(0)。 即 使 harmonic0 在 代码 中 首先 出 现 ， 但 Java 执行 
的 第 一 个 语句 仍然 是 main() 中 的 第 一 个 语句 。 接 下 来 的 几 个 语句 照常 运行 ， 除 了 每 次 遇 到 
调用 静态 方法 harmonic() 的 语句 时 ， 即 代码 harmonic(arg)， 会 导致 将 控制 流转 移 到 
harmonic() 中 的 第 一 行 代码 。 而 且 ， 在 调用 时 ，Java 将 harmonic() 中 的 参数 变量 n 初始 化 为 
main() 中 的 arg 值 。 那 么 ，Java 就 可 以 照常 执行 harmonic(0 中 的 语句 ， 直 到 它 到 达 一 个 
return 语句 ， 其 才 将 控制 传递 给 main(0 中 包含 对 harmonic0 的 调用 的 语句 。 此 外 ， 调 用 
harmonic(arg) 方法 将 会 产生 一 个 值 一 一 该 值 由 return 语句 指定 ， 在 harmonic() 的 代码 中 执行 
return 语句 返回 的 变量 是 sum。 然 后 Java 将 此 返回 值 赋 给 变量 value。 最 终结 果 与 我 们 的 直 
觉 完 全 吻合 : 第 一 次 赋值 给 value 的 值 是 1.0， 第 一 次 打印 出 来 的 值 也 是 1.0 一 一 这 个 值 就 是 
参数 变量 n 被 初始 化 为 1 时， 由 harmonic() 计算 的 值 。 第 二 次 为 value 赋值 并 打印 出 的 值 为 
1.5 一 一 即 当 n 初始 化 为 2 时 ， 由 harmonic() 计算 的 值 。 每 个 命令 行 参 数 重 复 相 同 的 过 程 ， 
在 harmonic() 和 main() 之 间 来 回 传递 控制 。 

跟踪 函数 调用 的 过 程 。 通 过 跟踪 来 分 析 函 数 调用 控制 流 的 


1=1 


一 个 简单 方法 是 ,假设 每 个 函数 在 被 调用 时 都 输出 其 名 称 和 参 
数值 ， 在 返回 之 前 显示 它 的 返回 值 ， 并 在 被 调用 时 添加 缩 进 ， 
返回 时 取消 缩 进 。 这 是 我 们 自 1.2 节 以 来 一 直 使 用 的 方法 ， 通 
过 打印 其 变量 的 值 来 对 程序 实现 跟踪 ， 而 且 现 在 ,我 们 要 加 强 
这 个 跟踪 方法 ， 把 函数 调用 的 过 程 也 显示 出 来 。 添 加 的 缩 进 将 
显示 控制 流 ， 并 帮助 我 们 检查 每 个 函数 是 否 具 有 我 们 预期 的 效 
果 。 通 常 ， 用 这 种 方式 添加 一 些 StdOut.println() 语句 来 跟踪 
程序 的 执行 ， 这 可 以 用 于 分 析 任 何 程序 的 控制 流 ， 是 用 于 分 析 
程序 功能 和 原理 的 好 方法 。 如 果 返 回 值 符合 我 们 的 期 望 ， 我 
们 不 需要 详细 地 跟踪 这 个 函数 代码 ， 从 而 为 我 们 节省 了 大 量 的 
3 

对 于 本 章 的 其 余部 分 ， 你 的 编程 工作 将 主要 围绕 创建 和 使 
用 静态 方法 展开 ， 因 此 有 必要 更 详细 地 研究 其 基本 属性 。 随 后 ， 
我 们 将 研究 几 个 关于 函数 实现 和 应 用 的 例子 。 

术语 。 将 抽象 概念 和 Java 的 具体 实现 机 制 进行 区 分 对 于 理 


arg = 工 
harmonic(1) 
sum = 0.0 
sum = 1.0 
return 1.0 
value = 1.0 
i =,2 
arg = 2 
harmonic(2) 
sum = 0.0 
sum = 1.0 
Sum = 1.5 
return 1.5 
value = 1.5 
is= 3 
arg = 4 
harmonic(4) 
sum = 0.0 
sum = 1.0 
sum = 1.5 
sum = 1.8333333333333333 
sum = 2.083333333333333 
return 2.083333333333333 
value = 2.083333333333333 


Java Harmonic 参数 为 
1、2、4 时 的 函数 调用 跟踪 


解 它们 是 很 有 帮助 的 (例如 ，Java 的 f 语 句 实现 了 条 件 分 支 ，while 语句 实现 了 循环 ， 以 此 
类 推 )。 以 下 表格 总 结 了 一 些 数 学 函数 概念 和 Java 结构 。 表 格 中 的 这 些 函 数 已 经 为 数学 家 使 
用 了 几 百 年 、 程 序 员 使 用 了 几 十 年 ， 因 此 我 们 不 会 详细 地 研究 函数 实现 的 具体 细节 ， 而 只 是 
关注 那些 有 利于 我 们 编程 的 部 分 。 

当 我 们 在 定义 数学 函数 的 公式 (如 fx)=14x+x”) 时 ， 公 式 中 使 用 的 符号 名 称 x* 是 输入 值 
的 占 位 符 ， 在 计算 时 它 将 被 输入 变量 替换 ， 并 通过 公式 计算 确定 输出 值 。 在 Java 中 ， 我 们 
使 用 一 个 参数 变量 (parameter variable) 作为 符号 占 位 符 ， 当 函数 被 调用 时 ， 将 特定 输入 值 
作为 参数 (argument) 为 其 赋值 并 进行 求 值 计算 。 
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概念 Java 结构 描述 

函数 静态 方法 映射 
输入 值 参数 输入 到 函数 
输出 值 返回 值 函数 输出 

公式 方法 主体 函数 定义 
自 变 量 参数 变量 输入 值 的 符号 占 位 符 


静态 方法 定义 。 静 态 方法 定义 的 第 一 行 ( 称 为 签名 )， 用 于 为 方法 和 每 个 参数 变量 提供 
一 个 名 称 。 它 还 指定 每 个 参数 变量 的 类 型 和 方法 的 返回 类 型 。 签 名 由 关键 字 public、 关 键 字 
static、 返 回 类 型 、 方 法 名 称 组 成 ， 也 可 以 包括 一 系列 参数 变量 。 参 数 变量 可 以 有 零 个 或 多 
个 ,用 逗号 分 隔 ， 并 括 在 括号 中 ， 标 明 变 量 类 型 和 名 称 。 我 们 将 在 下 一 节 中 讨论 public 关 
键 字 的 含义 ， 在 第 3 章 中 讨论 static 关键 字 的 含义 (从 技术 上 讲 ，Java 冲 的 签名 可 以 仅 包括 
方法 名 称 和 参数 类 型 ， 但 是 我 们 认为 此 种 表示 方式 仅 限 专业 人 员 使 用 )。 签 名 后 是 方法 主体 ， 
包含 在 大 括号 中 。 主 体 由 我 们 在 第 1 章 中 讨论 的 各 种 语句 组 成 。 它 可 以 包含 一 个 返回 语句 ， 
它 将 控制 传递 回 静 态 方法 被 调用 的 位 置 ， 并 返回 计算 结果 或 返回 值 。 主 体 也 可 以 声明 局 部 变 
量 ， 这 些 变量 只 能 在 声明 方法 的 内 部 使 用 。 


外 
院 名 返回 类 型 方法 名 称 参数 类 型 参数 变量 





public static ( [int nj 
{ 
局 部 变量 ,ldoubTie sum|j= 0.0; 


for (int i =°1; i <= n; 计 +) 
方法 主体 一 sum += 1.0/i; 
Sa [return sumj| 














返回 语句 
静态 方法 剖析 
函数 调用 。 正 如 你 已 经 看 到 的 ，Java 中 的 静态 方法 调用 只 不 过 是 方法 名 称 ; 其 紧 跟 着 

用 逗号 分 隔 并 括 在 括号 中 的 参数 ， 这 与 数学 函数 通 “Eeesssseesssaesssseesasssama ce 
常 的 格式 完全 相同 。 如 1.2 节 所 述 ， 方 法 调用 是 一 有 (int i = 0; i < args.length; i++) 。 
个 表达 式 ， 因此 你 可 以 使 用 它 来 构建 更 复杂 的 表达 和 arg = Integer.parseInt(args[i]); 色 
式 。 同样 ， 参 数 是 一 个 表达 式 一 一 Java 可 以 计算 表 有。 double ee 
达 式 ， 并 将 结果 传递 给 方法 。 所 以 ， 你 可 以 编写 像 1 而 六 | 用 参数 
Math.exp ( -x*x/2 ) / Math.sqrt (2*Math.PI) 这 样 的 AR te ea 
代码 ，Java 能 够 知道 你 的 意思 。 函数 调用 剖析 


多 个 参数 。 与 数学 函数 一 样 ，Java 静态 方法 可 以 接受 多 个 参数 ， 因 此 可 以 有 多 个 参数 变 
量 。 例 如 ， 下 面 的 静态 方法 用 直角 三 角形 的 直角 边 a 和 b 计算 其 斜 边 的 长 度 : 


public static double hypotenuse(double a, double b) 
{ return Math.sqrt(a*a + b*b); } 


虽然 在 这 种 情况 下 参数 变量 的 类 型 是 相同 的 ,但 通常 它们 可 以 是 不 同 的 类 型 。 每 个 参数 
变量 的 类 型 和 名 称 在 函数 签名 中 声明 ， 每 个 声明 用 逗号 分 隔 。 
多 个 方法 。 你 可 以 在 java 文件 中 定义 尽 可 能 多 的 静态 方法 。 每 个 方法 都 有 一 个 由 大 括号 括 
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起 来 的 语句 序列 组 成 的 主体 。 这 些 方 法 是 独立 的 ， 可 以 以 任何 顺序 出 现在 文件 中 。 静 态 方 法 可 
以 调用 在 同一 个 文件 中 的 任何 其 他 静态 方法 或 Java 库 中 的 任何 静态 方法 (如 Math)， 如 下 所 示 : 


public static double square(double a) 
{ return a*a; 3} 


public static double hypotenuse(double a, double b) 
{ return Math.sqrt(square(a) + square(b)); } 


另外 ， 我 们 在 下 一 节 中 可 以 看 到 ， 静 态 方法 可 以 调用 其 他 ,java 文件 中 的 方法 〈 只 要 
Java 可 以 访问 那些 文件 )。 在 2.3 节 中 ,我 们 将 研究 的 静态 方法 甚至 可 以 调用 自己 。 

重 载 。 静 态 方法 因 其 签名 不 同 而 不 同 。 例 如 ， 我 们 经 常 想 为 不 同 数值 类 型 的 值 定义 相同 
的 操作 ， 如 以 下 用 于 计算 绝对 值 的 静态 方法 : 


public static int abs(int x) 


if (x < 0) return -x; 
else return Xx; 


} 


public static double abs(double x) 
{ 

if (x < 0.0) return -x; 

else return Xx; 


} 


这 是 两 个 不 同 的 方法 ,但 是 足够 相似 ， 因 其 使 用 了 相同 的 名 称 ( abs)。 对 于 两 个 静态 
方法 ， 如 果 签 名 内 容 不 同 而 使 用 了 相同 的 名 称 ， 则 称 之 为 重 载 (overloading)， 这 在 Java 编 
程 中 较为 常见 。 例 如 ，Java Math 库 使 用 此 方法 为 所 有 基本 数值 类 型 提供 Math.abs()、Math. 
min() 和 Math.max() 的 实现 。 重 载 的 男 一 个 常见 用 法 是 定义 方法 的 两 个 不 同 版 本 : 一 个 使 用 
参数 ， 另 一 个 使 用 该 参数 的 默认 值 。 

多 个 返回 语句 。 你 可 以 将 return 语句 放 在 任何 位 置 : 一 旦 到 达 第 一 个 return 语句 ， 控 制 
将 返回 到 调用 程序 。 下 面 这 个 素数 测试 函数 就 是 一 个 使 用 多 个 返回 语句 的 例子 : 


public static boolean isPrime(int n) 


if (n < 2) return false; 

for (Cint i = 2; i <= n/i; i++) 
if (n % i == 0) return false; 

return true; 


} 


即使 可 能 有 多 个 return 语句 ,但 所 有 静态 方法 都 会 在 每 次 调用 时 返回 单个 值 ， 遇 到 的 第 
一 个 返回 语句 后 面 的 值 。 有 些 程序 员 坚 持 每 个 方法 应 该 只 有 一 个 返回 语句 ， 但 是 我 们 在 本 书 
中 没有 那么 严格 。 
public static int abs(int x) 
{ 
整 型 值 的 绝对 值 if (x < 0) return —x; 


else return xXx; 





实现 函数 的 典型 代码 (静态 方法 ) 
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public static double abs(double x) 
又 本 府 洲 点 { 
bn if (x < 0.0) return —x; 
型 值 的 绝对 值 ES re Se 


} 


public static boolean isPrime(int n) 
{ 
if (n < 2) return false; 
崇 数 检测 for (int i = 2; i <= n/i; i++) 
if (n % i == 0) return false; 
return true; 
} 
计算 直角 public static double, hypotenuse(double a, double b) 
三 角形 的 斜 边 { return Math.sqrt(a*a + b*b); } 


public static double harmonic(int n) 
{ 
double sum = 0.0; 


谐 波 数 for (int 1 = 1; i <= ni i++) 
sum += 1.0 / ji; 
return sum; 
} 
[0, n) 中 的 public static int uniform(int n) 
均匀 随机 整数 { return (int) (Math.random() * n); } 


public static void drawTriangle(double x0, double y0， 
double xl，double yl， 
double x2, double y2 ) 
{ 
StdDraw.1ine(x0, y0, xl1, yl1); 
StdDraw.1ine(x1, yl, x2, y2); 
StdDraw.1ine(x2, y2, x0, y0); 
} 


实现 函数 的 典型 代码 ( 静态 方法 ) 


单个 返回 值 。Java 方法 只 给 调用 者 提供 一 个 返回 值 ， 它 的 类 型 就 是 方法 签名 中 声明 的 类 
型 。 这 个 策略 并 不 像 它 看 起 来 那么 严格 ， 因 为 Java 数据 类 型 不 仅 限 于 基本 数据 类 型 ， 因 此 
可 以 包含 更 多 的 信息 。 本 节 后 半 段 ， 你 可 以 看 到 数组 被 用 作 返 回 值 。 

作用 域 。 变 量 的 作用 域 是 指 能 够 依据 其 变量 名 引用 这 一 变量 的 代码 范围 。 通 常 Java 的 
规则 是 : 在 一 个 语句 块 中 声明 的 变量 ， 其 作用 域 仅 限于 该 块 中 的 语句 。 尤 其 是 ， 静 态 方 法 中 
声明 的 变量 的 范围 仅 适用 于 该 方法 的 主体 。 因 此 ， 你 不 能 在 一 个 静态 方法 中 引用 另 一 个 静态 
方法 中 声明 的 变量 。 如 果 方 法 中 包含 了 较 小 的 块 ， 如 让 或 for 语句 体 ， 则 在 其 中 一 个 块 中 声 
明 的 任何 变量 的 作用 域 仅 限于 该 块 的 内 部 。 在 实际 的 编程 工作 中 ， 常 常会 出 现在 独立 的 代码 
块 中 使 用 相同 变量 名 的 情况 。 当 我 们 这 样 做 时 ， 我 们 要 清楚 这 些 其 实 是 不 同 的 变量 。 例 如 ， 
当 我 们 在 同一 程序 中 的 两 个 不 同 的 for 循环 中 使 用 索引 i 时， 我 们 一 直 遵 循 这 种 做 法 。 设 计 
软件 时 的 指导 原则 是 在 声明 每 个 变量 时 应 该 使 其 作用 域 尽 可 能 小 。 我 们 使 用 静态 方法 的 一 个 
重要 原因 就 是 它们 能 够 通过 限制 变量 作用 域 来 简化 调试 过 程 。 

副作用 。 在 数学 中 ， 函 数 将 一 个 或 多 个 输入 值 映射 到 某 个 输出 值 。 在 计算 机 编程 中 ， 许 
多 函数 也 遵从 这 一 模型 : 它们 接受 一 个 或 多 个 参数 ， 并 产生 单个 返回 值 。 纯 函数 是 这 样 一 种 
函数 ， 即 给 定 相同 的 参数 ， 总 是 返回 相同 的 值 ， 而 不 产生 任何 可 见 的 副作用 ， 这 些 副作用 可 
能 是 消耗 输入 、 产 生 输 出 或 以 其 他 方式 更 改 系统 的 状态 。 函 数 harmonic()、abs()、isPrime() 
和 hypotenuse() 都 是 纯 函 数 。 


绘制 一 个 三 角形 
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lic 六 
wi 此 代码 不 能 访问 
人 wen arte nm ue] args[] 、arg 或 者 value 
double sum = 0.0; 
for Cint 1 = 1; i <= n; i++) | 
n 和 和 sum 的 作用 域 eh Sl, 
, , 2 
人 不 同 的 变量 
blic stat mainCstring[] args) 
for (int i es 0; 1 < args.legnth; i++) EL i 和 args 的 作用 域 
b int arg = Integer.parseInt(args[i]); 训 
一 全 double value = harmonic(arg); 
arg 的 作用 域 l. ”| Stdout .println(Cvalue) ; 一 轴 此 代码 不 能 
0 | 引用 nm 或 者 sum 





由 | 站 1 
局 部 变量 和 参数 变量 的 作用 域 


然而 ， 在 计算 机 编程 中 ,产生 副作用 有 时 也 是 有 益 的 。 事 实 上 ,我 们 经 常 定义 只 产生 副 
作用 的 函数 。 在 Java 中 ， 静 态 方法 可 以 使 用 关键 字 void 作为 其 返回 类 型 ， 以 指示 它 没有 返 
回 值 。void 类 型 的 静态 方法 中 不 需要 显 式 调 用 return 语句 : 在 Java 执行 方法 的 最 后 一 个 语 
名 之后， 控制 返回 给 调用 者 。 

例如 ， 静态 方法 StdOut.println() 的 副作用 是 将 给 定 参数 打印 到 标准 输出 〈 这 个 函数 没有 
返回 值 ， 副 作用 也 可 以 说 是 它 的 主 作 用 )。 类 似 地 ， 以 下 静态 方法 的 副作用 是 将 三 角形 绘制 
到 标准 绘图 (并 且 没 有 指定 的 返回 值 ): 

public static void drawTriangle(double x0, double y0， 

double xl1, double y1， 
double x2, double y2) 

1 StdDraw.1line(x0, y0, x1, yl); 

StdDraw.1line(x1l, yl, x2, y2); 
StdDraw.1line(x2, y2, x0, y0); 

} 

从 编程 技巧 上 来 说 ,一 般 编写 一 个 既 产 生 返 回 值 又 能 够 产生 副作用 的 静态 方法 并 非 良 策 。 
一 个 典型 的 例外 是 读 取 输 入 的 函数 。 例 如 ，StdIn.readInt( 返回 一 个 值 (一 个 整数 ) 并 产生 副 
作用 (从 标准 输入 中 消耗 一 个 整数 )。 在 本 书 中 ,我 们 使 用 void 静态 方法 有 两 个 主要 目的 : 

。 对 于 1/O, 使 用 StdIn、StdOut、StdDraw 和 StdAudio。 

。 操纵 数组 的 内 容 。 

从 HelloWorld 中 的 main() 开始 ， 你 一 直 在 使 用 void 类 型 的 静态 方法 ,我 们 将 在 本 节 稍 
后 讨论 它们 在 数组 中 的 用 法 。 从 第 3 章 开始 ， 我 们 将 以 Java 支持 的 特定 方式 ,在 Java 中 编 
写 具 有 其 他 副作用 的 方法 。 

实现 数学 函数 ”为 什么 不 直接 使 用 Java 中 定义 的 方法 ， 如 Math.sqrt0 ? 答案 是 : 当 
Java 库 里 存在 时 ， 我 们 可 以 使 用 ; 但 我 们 可 能 希望 使 用 的 数学 函数 是 无 限 数量 的 ， 而 库 中 只 
有 很 小 的 一 部 分 。 当 你 使 用 不 在 库 中 的 数学 函数 时 ， 需 要 实现 相应 的 静态 方法 。 

作为 示例 ， 我 们 考虑 一 段 常 用 而 且 重 要 的 代码 ， 相 信 许 多 美国 高 中 生 和 大 学 生 会 对 其 颇 
感 兴趣 。 近 一 年 来 ， 有 100 多 万 名 学 生 参 加 了 “美国 高 考 ” 。 因 为 学 生 可 以 选择 参加 不 同 的 
考试 ， 因 此 学 生 的 分 数 从 400 分 (最低 ) 到 1600 分 (最 高 ) 不 等 。 这 些 分 数 在 做 出 一 些 重要 
决定 时 起 到 关键 的 作用 : 例如 ， 学 生 运 动员 必须 获得 至 少 820 分 ， 申 请 某 些 学 术 奖 学 金 的 最 
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低 资 格 要 求 为 1500 分 。 那 么 ， 在 美国 的 高 考 中 ， 有 多 少 人 不 符合 学 生 运 动员 的 要 求 ? 有 多 
少 人 可 以 拿 到 奖学金 ? 


概率 密度 函数 % 累积 分 布 函 数 中 
1 1 





BD 
面积 为 O(z) 


x 0 





高 斯 概率 函数 


统计 学 的 两 个 函数 使 我 们 能 够 准确 地 回答 这 些 问题 。 高 斯 ( 正 态 ) 概率 密度 函数 (Gaussian 
( normal) probability density function) 的 函数 曲线 相信 大 家 都 很 熟悉 ， 其 公式 为 wo)=e<2/Pm 。 
高 斯 累积 分 布 函 数 (Gaussian cumulative distribution function) @(Cz) 是 指 由 $(x) 定义 的 曲线 下 
方 x 轴 上 方 、 垂 直线 去 z 的 左 侧 区 域 的 面积 。 这 两 个 函数 因 其 对 自然 世界 的 准确 描述 和 对 实 
验 错误 的 纠正 ， 在 科学 、 工 程 和 金融 领域 起 到 了 重要 作用 。 

特别 需要 说 明 的 是 ,这 两 个 函数 可 以 用 于 准确 地 描述 本 例 中 分 数 的 分 布 (其 值 每 年 都 会 
公布 )， 并 且 可 以 描述 为 平均 值 (分 数 的 平均 值 ) 和 标准 差 ( 每 个 分 数 和 平均 值 之 间 差 异 的 平 
方 和 再 求 平方 根 ) 的 函数 。 知 道 了 平均 值 yx 和 考试 成 绩 的 标准 差 o， 通 过 函数 @((z-/0/o) 可 
计算 分 数 小 于 给 定 值 z 的 学 生 的 百分比 。 计 算 pp 和 @ 的 静态 方法 在 Java 的 Math 库 中 不 可 

用 ， 因 此 我 们 需要 开发 自己 的 函数 。 

封闭 形式 。 如 果 我 们 用 一 个 公式 来 定义 我 们 需要 的 函数 ， 最 简单 的 情况 下 ， 公 式 中 的 每 
一 个 组 成 元 素 都 可 以 用 Java 函数 库 中 的 函数 直接 实现 。 这 种 情况 称 为 封闭 形式 。# 就 是 这 
种 情况 一 一 Java 的 Math 库 中 包含 了 计算 指数 和 平方 根 函 数 的 方法 (以 及 常量 wm 的 值 )， 因 
此 ， 与 其 数学 定义 相对 应 的 静态 方法 pdf() 是 易于 实现 的 (参见 程序 2.1.2 )。 

非 封 闭 形 式 。 在 某 些 情况 下 ， 我 们 可 能 需要 更 复杂 的 算法 来 计算 函数 值 。 对 于 @ 的 实 
现 就 是 这 种 情况 一 一 此 函数 没有 封闭 形式 的 表达 式 。 为 了 近似 估算 函数 的 值 ,， 有 时 会 使 用 泰 
勒 级 数 通 近 法 。 实 际 上 上 ， 为 数学 函数 建立 可 靠 而 精确 的 代码 实现 是 科学 和 艺术 的 结合 ， 有 时 
需要 使 用 过 去 几 个 世纪 积累 的 数学 知识 。 已 经 有 多 种 不 同 的 方法 可 以 用 于 近似 估算 B® 。 例 
如 ， 可 以 使 用 一 个 泰勒 级 数 来 逼近 四 和 #$ 的 比率 ， 从 而 得 出 以 下 计算 关系 : 

Bz) 3+$ (D223+2)3 ee 

此 公式 可 以 轻易 转换 为 程序 2.1.2 中 的 静态 方法 cdf0() 的 Java 代码 。 对 于 z 较 小 的 情况 ， 
该 值 非常 接近 于 0， 因 此 代码 直接 返回 0; 对 于 z 较 大 的 情况 ， 该 值 非常 接近 于 1， 因 此 代码 
直接 返回 1; 否则 ， 通 过 不 断 展开 泰勒 级 数 的 项 来 计算 上 述 关系 式 ， 直 到 计算 的 结果 收敛 ( 即 
展开 后 新 增加 的 泰勒 级 数 项 的 值 已 经 不 再 影响 计算 结果 一 一 译 者 注 )。 

使 用 适当 的 参数 在 命令 行 中 运行 Gaussian 程序 ， 可 以 得 到 约 17% 的 考生 不 符合 体育 运 
动 资格 ， 只 有 约 1% 的 有 资格 获得 奖学金 。 在 平均 值 为 1025 和 标准 差 为 231 的 一 年 中 ， 约 
有 2% 的 人 有 获得 奖学金 资格 。 

各 种 数学 函数 的 计算 一 直 在 科学 和 工程 中 起 着 重要 的 作用 。 在 许多 应 用 程序 中 ， 有 时 候 
你 需要 的 函数 存在 于 Java 的 数学 库 中 ， 如 我 们 刚刚 看 到 的 pdf() ; 有 时 候 可 以 简单 地 使 用 泰 
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勒 级 数 逼 近 进 行 计算 ， 如 我 们 刚刚 看 到 的 edfOs 事实 上 ， 实 现 这 类 计算 任务 在 计算 系统 和 
编程 语言 的 演进 过 程 中 发 挥 了 核心 作用 。 你 将 在 本 书 官网 和 本 书 中 找到 许多 例子 。 










程序 2.1.2 ”高 斯 函数 









public class Gaussian 
{ /高 斯 《 正 态 ) 概率 密度 函数 的 实现 
public static double pdf(double x) 
{ 


return Math.exp(-x*x/2) / Math.sqrt(2*Math.PI); 


public static double cdf(double z) 
{ > 


















if (z < -8.0) return 0.0; 


if (z > 8.0) return 1.0; 5 抽 累计 总 和 
double sum = 0.0; term | 当前 值 





double term = Zz; 
for (int i = 3; sum != Sum + term; i += 2) 
{ 

sum = sum + term; 

term = term * z*2z/i; 


二 
return 0.5 + pdf(z) * sum; 


public static void main(String[] _ args) 


double z = Double.parseDouble(args[0]); 
double mu = Double.parseDouble(args[1]); 
double sigma = Double.parseDouble(args[2]); 
StdOut.printf("%.3f\n", cdf((z - mu) / sigma)); 





该 代码 实现 了 高 斯 概率 密度 函数 ( pdf ) 和 高 斯 累积 分 布 函数 (cdf ) ， 
这 些 函 数 并 未 在 Java 的 Math 库 中 。 计 算 pdfO 直 接 来 自 其 定义 ， 计 算 cdf0 需 要 
使 用 泰勒 级 数 ， 并 调用 pdfO0《〈 参 见 补充 内 容 和 练习 1.3.38) 。 


% java Gaussian 820 1019 209 
0.171 


% java Gaussian 1500 1019 209 
0.989 
% java Gaussian 1500 1025 231 
0.980 


使 用 静态 方法 来 组 织 代码 ”静态 方法 实现 了 在 输入 值 的 基础 上 计算 输出 值 的 过 程 ， 因 
此 ， 除 了 用 于 实现 数学 函数 之 外 ， 作 为 在 计算 任务 中 组 织 控制 流 的 通用 技术 ， 也 是 很 重要 
的 。 这 样 做 体现 了 一 个 非常 重要 的 原则 ， 也 是 程序 员 的 重要 指导 原则 ， 即 ， 在 编程 时 ， 要 尽 
可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 任务 ;然后 分 别 实现 。 

对 于 表达 计算 任务 ， 使 用 函数 是 非常 自然 的 。 实 际 上 ， 我 们 在 1.1 节 接 触 的 第 一 个 Java 
程序 (“ Java 程序 的 直观 图 ”)， 就 是 把 它 当 成 一 个 函数 来 看 待 的 ， 从 那里 开始 ， 我 们 就 将 
Java 程序 视 作 将 命令 行 参数 转换 为 输出 字符 串 的 函数 。 在 一 个 计算 任务 的 不 同 层面 ， 我 们 都 
可 以 按照 这 样 的 方式 来 分 析 问 题 ( 即 在 不 同 层面 将 计算 的 子 任务 简单 地 看 成 处 理 输 入 数据 并 
产生 输出 数据 的 函数 一 一 译 者 注 )。 而 且 ， 在 通常 情况 下 ,我 们 也 自然 地 把 大 段 的 程序 以 功能 
为 单位 进行 分 割 ， 以 函数 的 方式 来 表示 ， 而 不 是 把 它们 简单 地 记 作 Java 赋值 、 条 件 和 循环 语 
句 的 序列 。 有 了 定义 函数 的 能 力 ， 我 们 可 以 通过 在 适当 的 时 候 定义 函数 来 更 好 地 组 织 程序 。 
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例如 ，Coupon (程序 2.1.3 ) 是 CouponCollector (程序 1.4.2 ) 的 一 个 版 本 ， 它 更 明确 地 
分 离 了 计算 的 各 个 组 成 部 分 。 例 如 在 程序 1.4.2 中 ， 你 要 确定 三 个 独立 的 任务 : 

。 给 定 n， 计 算 随 机 卡 券 的 值 。 

。 给 定 n， 做 卡 券 收 集 实验 。 

。 从 命令 行 获取 n， 然 后 计算 并 打印 结果 。 

Coupon 重新 排列 CouponCollector 中 的 代码 ， 可 以 清晰 地 反映 出 这 三 个 函数 如 何 配 合并 
最 终 实 现 了 计算 任务 。 这 样 组 织 代码 之 后 ,我 们 可 以 改变 getCoupon()( 例 如 ， 我 们 可 能 希 
望 从 不 同 的 分 布 中 抽取 随机 数 ) 或 main() (例如 ， 我 们 可 能 需要 多 次 输入 或 运行 多 个 实验 )， 
而 不 必 担 心 collectCoupons() 会 有 任何 改变 。 

使 用 静态 方法 可 以 将 实验 的 不 同 组 成 部 分 相互 隔离 或 者 封装 ( encapsulate)。 通 常 ， 程 
序 由 许多 不 同 的 部 分 组 成 ， 将 其 明确 地 划分 为 不 同 的 静态 方法 的 做 法 更 有 利 。 在 我 们 再 看 到 
其 他 几 个 例子 之 后 ,我 们 将 进一步 详细 讨论 这 些 益处 。 其 实 这 样 做 的 好 处 非常 容易 理解 ， 在 
程序 中 通过 将 它 分 解 成 函数 来 更 好 地 表达 计算 ， 就 像 在 文章 中 把 它 分 成 几 段 能 更 好 地 表达 一 


个 想法 一 样 。 在 编程 时 ， 要 尽 可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 任务 ， 然 后 分 别 实现 。 


程序 2.1.3 ”模拟 卡 券 收集 (二 ) 
public class Coupon 
过 


public static int getCoupon(int n) 
{ // 返回 一 个 0 到 fi-1 之 间 的 随机 整数 


return (int) (Math.random() * n); 


public static int collectCoupons(int n) 
{ 7/ 收集 卡 券 ， 直 到 每 张 都 有 
// 并 返回 收集 到 的 卡 券 的 数量 
boolean[] isCollected = new boolean[n] ; 
int count = 0, distinct = 0; 
while (distinct < n) 
: n 卡 券 的 值 (0 到 n-] 之 间 ) 此 
int r = getCoupon(n); isCollected[i] | 卡 券 是 否 已 经 被 收集 到 ? 


Count++; gE 
istinct++; pe 
, r 随机 的 卡 券 


isCollected[r] = true; 


return count; 
} 
public static void main(String[] args) 
{ 收集 到 了 n 张 不 同 的 卡 券 
int n = Integer.parseInt(args[0]); 
int count = collectCoupons(n); 
StdOut.printin(count); 


} 
这 是 程序 1.4.2 的 另 一 个 实现 版 本 。 这 个 版 本 用 于 说 明 在 静态 方法 中 封装 
计算 的 代码 样式 ; 此 代码 与 CouponCollector 的 效果 相同 ， 但 组 织 结构 更 好 ， 


它 将 代码 分 成 三 个 组 成 部 分 : 在 0 和 n-1 之 间 生 成 二 个 随机 整数 、 运 行 一 个 
卡 券 收集 实验 ， 以 及 管理 输入 输出 。 


% java Coupon 1000 % java Coupon 10000 
6522 105798 

% java Coupon 1000 % java Coupon 1000000 
6481 12783771 
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传递 参数 和 返回 值 ” 接 下 来 ,我 们 将 研究 Java 中 参数 传递 给 函数 和 取得 返回 值 的 具体 
机 制 。 这 些 机 制 在 概念 上 是 非常 简单 的 ， 但 值得 花 时 间 去 充分 理解 ， 因 为 这 套 机 制 的 作用 是 
深刻 的 。 了 解 参数 传递 和 返回 值 机 制 是 学 习 任何 新 的 编程 语言 的 关键 。 

按 值 传递 。 你 可 以 在 函数 本 体 的 任意 位 置 代 码 中 使 用 参数 变量 ， 方 法 与 使 用 局 部 变量 的 
方式 相同 。 参 数 变 量 和 局 部 变量 之 间 的 唯一 区 别 是 : Java 会 计算 调用 者 传递 的 参数 表达 式 的 
值 ， 然 后 用 计算 的 结果 来 为 参数 变量 初始 化 。 此 方法 称 为 按 值 传递 ( pass by value)。 该 方法 
使 用 其 参数 的 值 ， 而 不 是 参数 本 身 。 这 种 方法 的 一 个 结果 是 ， 改 变 参 数 变量 的 值 对 此 静态 方 
法 中 的 调用 代码 没有 影响 (为 了 清楚 起 见 ， 我 们 不 会 在 本 书 的 代码 中 更 改 参数 变量 )。 在 某 
些 编程 环境 中 ， 有 一 种 称 为 通过 引用 传递 (pass by reference) 的 替代 方法 ， 该 方法 可 以 直接 
修改 调用 代码 的 参数 。 

静态 方法 可 以 将 数组 作为 参数 ， 或 者 将 数组 返回 给 调用 者 。 这 个 功能 是 Java 面向 对 象 的 
一 个 特例 ， 这 也 是 第 3 章 的 主题 之 一 。 因 为 基本 的 机 制 很 容易 理解 和 使 用 ， 我 们 在 本 节 中 开 
始 学 习 这 一 点 ， 使 得 我 们 可 以 使 用 数组 处 理 大 量 数 据 ， 从 而 为 许多 问题 提供 编程 解决 方案 。 

数组 作为 参数 。 当 静态 方法 将 数组 作为 参数 时 ， 它 可 以 实现 对 同一 类 型 的 任意 数量 的 值 
进行 操作 。 例 如 ， 下 面 的 静态 方法 计算 双 精 度数 组 的 平均 值 : 


public static double mean(double[] a) 


double sum = 0.0; 

for (int 1 = 0; i < a.length; i++) 
sum += a[i]; 

return sum / a.length; 


实际 上 ， 从 第 一 个 程序 开始 ， 我们 就 一 直 在 使 用 数组 作为 参数 。 代 码 


public static void main(String[] args) 


这 一 句 将 main() 定义 为 静态 方法 ， 它 将 字符 串 数 组 作为 参数 并 不 返回 任何 值 。 按 照 约 定 ， 
Java 系统 会 将 你 在 Java 命令 中 程序 名 后 键入 的 字符 串 收集 到 一 个 数组 中 ， 并 将 该 数组 作为 
参数 调用 main0 (大 多 数 程序 员 使 用 arg 作为 参数 变量 的 名 称 ， 虽 然 任 何 名 称 都 是 可 以 的 )。 
在 main() 中 ， 我 们 可 以 像 处 理 任何 其 他 数组 一 样 操作 该 数组 。 

数组 的 副作用 。 通 常情 况 下 ， 以 数组 作为 参数 的 静态 方法 的 目的 是 产生 副作用 (更 改 数 
组 元 素 的 值 )。 这 种 方法 的 一 个 典型 示例 是 在 给 定数 组 中 ， 交 换 两 个 给 定 索引 位 置 的 值 。 我 
们 可 以 修改 1.4 节 开 始 给 出 的 代码 : 


public static void exchange(String[] a, int i, int j) 


String temp = a[i]; 
a[i] = a[j]; 
a[j] = temp; 


这 种 实现 方式 源 于 Java 的 数组 表示 形式 。exchange() 中 的 参数 变量 是 对 数组 的 引用 ， 
而 不 是 数组 值 的 副本 : 当 将 数组 作为 参数 传递 给 方法 时 ， 该 方法 有 机 会 将 值 重 新 分 配给 该 
数组 中 的 元 素 。 采 用 数组 参数 并 产生 副作用 的 静态 方法 的 第 二 个 典型 示例 是 基于 1.4 节 中 代 
码 而 来 的 shuffle 函数 ， 这 个 函数 用 于 随机 地 打 乱 数组 中 的 值 (其 中 使 用 了 本 节 前 面 提 到 的 
exchange() 和 uniform() 方法 ): 
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public static void shuffle(String[] a) 


int n = a.length; 
for (int i = 0; i <.n; i++) 
exchange(a, i, 1 + uniform(n-1)); 


public static double max(double[] a) 
{ 


double max = Double.NEGATIVE_INFINITY; 
查找 数组 中 的 最 大 值 for (int i = 0; i < a.length; i++) 
if (a[i] > max) max = a[i]; 
return max; 
} 


public static double dot(double[] a, double[] b) 
{ 
double sum = 0.0; 
点 积 for (int i = 0; i < a.length; i++) 
sum += a[i] * b[i]; 
return sum; 


public static void exchange(String[] a, int i, int j) 
{ 


交换 数组 中 的 String temp = a[i]; 
两 个 元 素 的 值 a[i] = a[j]; 
a[j] = temp; 


} 


public static void print(double[] a) 
{ 
打印 一 维 数组 Stdout .printin(a.1length); 
(及 其 长 度 ) for (int i = 0; i < a.length; i++) 
Stdout .printin(a[i]); 
} 


public static double[ J[] readDouble2D() 
{ 


int m = StdIn.readInt(); 

int n = StdIn.readInt(); 
以 行为 主 顺 序 读 取 double[][] a = new double[m][n]; 
二 维 数组 ( 带 维度 ) for (int i = 0; i < mi i++) 

for (int j = 0; j < ni j++) 
a[i][j] = StdIn.readDouble( ); 
return a; 
} 


使 用 数组 做 参数 或 返回 值 的 函数 的 典型 代码 实现 


类 似 地 ， 我 们 将 在 4.2 节 讨 论 如 何 对 数组 进行 排序 (重新 排列 它们 的 值 以 使 它们 按 顺序 
排列 )。 所 有 这 些 例 子 都 是 在 强调 以 下 基本 的 事实 ， 在 Java 的 数组 传递 机 制 中 ， 对 于 数组 的 
引用 实现 的 是 按 值 传递 ， 而 对 于 数组 元 素 本 身 实 现 的 是 按 引 用 传递 。 与 基本 类 型 参数 不 同 ， 
函数 对 数组 元 素 所 做 的 更 改 能 够 反映 在 调用 者 程序 中 。 以 数组 作为 参数 的 函数 不 能 更 改 数组 
本 身 一 一 数组 的 内 存 位 置 、 长 度 和 类 型 ， 均 与 创建 数组 时 相同 ,但 函数 可 以 修改 数组 中 元 素 
的 值 。 

数组 作为 返回 值 。 如 果 一 个 方法 对 参数 传递 的 数组 进行 了 排序 、 重 组 ,或 以 其 他 方式 修 
改 ， 不 必 返 回 对 该 数组 的 引用 ， 因 为 它 正 在 更 改 调用 者 数组 的 元 素 而 不 是 副本 。 但 是 在 很 多 
情况 下 ， 静 态 方 法 需要 提供 一 个 数组 作为 返回 值 ， 特 别 是 某 些 静 态 方 法 的 主要 目的 是 返回 多 
个 相同 类 型 的 值 给 调用 端 。 例 如 ， 以 下 静态 方法 创建 并 返回 StdAudio 使 用 的 数组 ( 见 程序 
1.5.7 ): 它 包含 了 以 给 定 频 率 (单位 为 赫兹 ) 的 正弦 波 和 给 定 的 持续 时 间 (单位 为 秒 ) 来 采样 
的 值 ， 标 准 为 每 秒 44 100 个 样本 。 
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public static double[] tone(double hz, double t) 


int SAMPLING_RATE = 44100; 
int n = (int) (SAMPLING_RATE * t); 
double[] a = new double[n+1]; 
for (Cint i1 = 0; i <= n; i++) 
a[i] = Math.sin(2 * Math.PI * 1 * hz / SAMPLING_ RATE); 
return a; 


} 


在 此 代码 中 ,返回 的 数组 长 度 取决 于 持续 时 间 : 如 果 给 定 的 持续 时 间 为 t， 则 数组 的 长 
度 大 约 为 44 100 t。 通 过 类 似 静 态 方法 ， 我们 可 以 编写 将 声波 视 为 单个 实体 的 代码 (包含 采 
样 值 的 数组 )， 如 程序 2.1.4 中 所 见 。 

示例 : 声波 又 加 ”如 1.5 节 中 讨论 的 ,我们 研究 的 简单 音频 模型 需要 进行 “润色 ”， 以 
产生 类 似 于 乐器 发 出 的 声音 。 润 色 的 方法 有 很 多 ,我 们 可 以 用 函数 来 实现 一 种 。 我 们 系 
统 地 使 用 静态 方法 创建 的 声波 ， 远 比 1.5 节 介 绍 的 简易 正弦 波 要 复杂 得 多 。 这 是 一 个 复杂 
而 有 趣 的 计算 问题 ,为 了 有 效 地 描述 如 何 解决 这 个 问题 ， 我 们 想象 一 个 程序 ， 它 必须 与 
PlayThatTune (程序 1.5.7) 具有 相同 的 功能 ,但 可 以 分 别 增加 一 个 高 八 度 和 一 个 低 八 度 的 和 
弦 ， 以 创建 更 真实 的 声音 效果 。 

和 弦 与 和 声 。 类 似 Concert A 的 音符 声调 单一 ， 听 起 来 都 不 是 很 悦耳 ， 因 为 我 们 习惯 听 到 
的 声音 含有 许多 其 他 成 分 。 比 如 吉他 大 弦 的 声音 是 由 乐器 的 木 制 部 分 、 你 所 在 的 房间 的 墙壁 等 
各 个 因素 相互 影响 的 结果 。 你 也 可 以 想象 修改 基本 正弦 波 的 效果 ， 比 如 ， 大 部 分 乐器 都 能 产生 
和 声 (同一 音符 不 同 的 八 度 ， 而 不 是 加 大 音量 )， 或 者 你 可 以 演奏 和 弦 (多 个 音符 同时 演奏 )。 
要 结合 多 个 声音 ， 我 们 就 要 使 用 登 加 (superposition ) : ye 
将 波 进行 简单 到 加 并 进行 缩放 ， 以 确保 所 有 值 保持 在 -1 cx 
和 +1 之 间 。 事 实证 明 ， 当 我 们 以 这 种 方式 蚕 加 不 同 频率 “了 人 人 
的 正弦 波 时 ， 我 们 可 以 得 到 任意 复杂 的 波 。 事 实 上 ，19 ”AAAv 
世纪 数学 的 伟大 成 就 之 一 就 是 任何 平滑 的 周期 函数 可 以 
表示 为 正弦 和 余弦 波 的 和 ， 这 就 是 传 里 叶 级 数 (Fourier A ~、440.00 
series)。 对 应 这 个 数学 概念 ， 则 表示 我 们 可 以 用 乐器 或 ^ 880.00 
我 们 的 声带 在 极 大 范围 内 创建 声音 ， 所 有 声音 都 由 各 种 CoReerA 训 和 声 
振荡 曲线 的 组 成 构成 。 音 对 应 曲线 ， 曲 线 对 应 声音 ， 通过 大 加 波 来 合成 声音 
我 们 可 以 创建 出 任意 复杂 的 县 加 曲线 。 

加 权 司 加 。 为 了 在 计算 机 中 存储 和 表示 声波 ;我 们 在 相同 的 采样 点 上 对 声波 进行 采样 ， 
然后 将 这 些 采 样 得 到 的 数字 组 合成 为 数组 来 表示 声波 。 按 照 这 样 的 方式 ， 声 波 疤 加 是 很 容易 
实现 的 : 我 们 把 每 个 采样 点 的 值 相 加 ， 然 后 按照 比例 重新 缩放 ， 即 可 达到 又 加 的 效果 。 为 
了 更 好 地 控制 ， 我 们 为 要 等 加 的 两 个 波 各 指定 一 个 相对 权重 ， 权 重 应 该 是 正 数 且 总 和 为 1。 
例如 ， 如 果 我 们 想 要 第 一 个 声音 的 效果 是 第 三 个 声音 的 3 倍 ， 第 一 个 声音 的 权重 将 分 配 为 
0.75， 第 二 个 的 权重 为 0.25。 现 在 ， 假 设 一 个 波 存储 在 数组 af ] 中 ， 相 对 权重 为 awt; 另 一 个 
存储 在 数组 b[ ] 中 ， 相 对 权重 为 bwt， 我 们 计算 它们 的 加 权 和 的 代码 如 下 : 

double[] c = new double[a.1length]; 


for (int 1 = 0; i < a.length; i++) 
c[i] = a[i]*awt + b[i]*bwt; 


权重 必须 为 正 、 总 和 为 1 确保 了 又 加 后 的 波 的 所 有 值 都 保持 在 -1 和 +1 之 间 





440.00 
554.37 
659.26 
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1o = tone(220, 1.0/220.0) 
1o[44] = 0.982 


hi = tone(880, 1.0/220.0) 
hi[44] = -0.693 


harmonics = superpose(l1o, hi, 0.5, 0.5) 
harmonics[44] 

0.5*10o[44] + 0.5*hi[44] 
0.5*0.982 + 0.5*(-0.693°) 
0.144 


Li 


concertA = tone(440, 1.0/220.0) 
concertA[44] = 0.374 


superpose(harmonics, concertA, 0.5, 0.5) 
0.5*harmonics[44] + 0.5*ConcertA[44]) 

= 0.5+*.144 + 0.5*0.374 

= 0.259 


向 Concert A 添加 和 声 ( 1/220 秒 ，44 100 个 样本 / 秒 ) 


程序 2.1.4 


按 调 演奏 (改进 版 ) 


public class PlayThatTuneDeluxe 


public static double[] superpose(double[] a, double[] b, 


{ 


} 


public static double[] tone(double hz, double t) 
> 


public static double[] note(int pitch, double +) 
/ 演奏 一 个 给 定 音 高 的 音符 二 并 伴随 和 声 
440.0 * Math.pow(2，pitch / 12.0); 


二 


} 


1/ 将 a 和 和 b 按 照 权 重合 加 


double[] c = new double[a.length]; hz 
for (int i = 0; i < a.length; i++) a[] 
c[i] = a[i]*awt + b[i]*bwt; hi[] 


return cc; 


如 正文 所 示 


double hz = 
double[] a 
double[] hi 
double[] 1o 
double[] h 


tone(hz, +t); 


tone(2*hz, t); 
tone(hz/2, t); 


superpose(hi 


double awt, double bwt) 











1o[] | 
ho | 深 加 和 声 后 的 声音 上 





oO O33. OuDs 


return superpose(a, h, 0.5, 0.5); 


public static void main(String[] args) 
1 读 取 并 演奏 一 首 曲 子 ， 伴 随和 声 
while (!StdIn.isEmpty()) 
{ /1 读 取 并 演奏 一 个 音符 ， 并 伴随 和 声 
int pitch = StdIn.readInt(); 
double duration = StdIn.readDouble(); 
double[] a = note(pitch, duration); 
StdAudio.play(a); 


{ 








该 代码 使 用 静态 方法 来 润色 程序 1.5.7 生 成 的 声音 ,从 而 产生 了 比 纯音 更 逼真 


的 和 声 。 


elise.txt 


% java PlayThatTuneDeluxe < elise.txt 





日 ” 原 书 此 处 漏 掉 了 负 号 。 一 一 译 者 注 
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程序 2.1.4 实现 了 以 上 这 些 设计 和 概念 ， 并 生成 比 程 序 1.5.7 更 逼真 的 声音 。 为 了 实现 
这 一 点 ， 它 使 用 函数 将 计算 任务 分 为 四 个 部 分 : 

。 给 定 频率 和 持续 时 间 ， 创 建 一 段 纯音 。 

。 给 出 两 个 声波 和 相对 权重 ， 将 它们 又 加 起 来 。 

。 给 定 音 高 和 持续 时 间 ， 创建 一 个 带 和 声 的 音符 。 

。 从 标准 输入 读 取 一 系列 音 高 及 其 持续 时 间 ， 在 音频 输出 上 播放 它们 。 

这 些 子 任务 中 ， 每 一 个 都 可 以 实现 为 一 个 函数 ， 然 后 这 些 函 数 相 互 依赖 以 完成 整个 计算 
任务 。 每 个 功能 都 有 明确 的 定义 ， 并 且 实 现 起 来 也 很 容易 。 所 有 这 些 函 数 (包括 StdAudio) 
都 是 用 一 系列 浮 点 数组 成 的 数组 来 表示 声音 (以 每 秒 44 100 个 样本 进行 采样 )。 

到 目前 为 止 ， 函 数 的 使 用 都 大 大 简化 了 我 们 的 编程 任务 。 例 如 ， 程序 2.1.1 一 2.1.3 中 的 
控制 流 很 简单 ， 每 个 函数 只 在 代码 中 的 一 个 位 置 调用 。 相 比 之 下 ，PlayThatTuneDeluxe( 程 
序 2.1.4 ) 更 能 说 明定 义 函 数 来 组 织 计算 的 有 效 性 ， 因 为 这 个 程序 中 的 函数 被 多 次 调用 。 例 
如 ， 函 数 note() 两 次 调用 函数 tone()、 三 次 调用 函数 sum()。 如 果 不 使 用 函数 ， 我 们 将 需要 
把 tone() 和 sum() 的 代码 在 程序 中 复制 很 多 次 ; 在 使 用 函数 之 后 , 我 们 可 以 按 功能 将 这 些 代 
码 片段 封装 ， 然 后 在 编写 程序 的 过 程 中 更 加 关注 于 应 用 功能 的 设计 。 同 循环 很 类 似 ， 函 数 也 
有 一 个 简单 而 意义 深远 的 效果 : 一 个 语句 序列 〈 在 函数 中 定义 ) 在 程序 执行 期 间 可 以 被 多 次 
执行 一 一 每 当 main() 的 控制 流 中 调用 到 这 个 函数 时 就 会 被 执行 一 次 。 











supe' 
(double[] a, double[] b, 
double awt, double bwt) 


, 
double[] c = new ee. length]; 
for (int 1 = 0; .length; 

c[i] = te 人 十 pri] bwt; 
return c; 










int RATE = 

int n = (int) (RA 

double[] a = 有 optetnvali 

for (int i = 0; ; i++) Wh 
a[i] = Math. Sin 人 Math, PI *i1* hz / RATE); 

return a; F 



















double 
doub1e0]” 和 


double[] hi = 
double[] 1o = 
double[] h = 
return(Superpose(a, h, .5, .5);) 


owC2, pitch / 12.0); 1 










ic static void mainCGtring[] args) 
Ee 〔!StdIn.isEmptyO) 


入 
图 
加 


int pitch = readIntO; 


double dur dDo D3 
内 : = Se ration): 


double[] 
StdAudio.play(a); 






| 
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函数 (静态 方法 ) 很 重要 ， 使 用 它们 ， 我 们 可 以 在 程序 中 扩展 Java 语言。 对 于 那些 
已 经 实现 好 并 且 充 分 调试 的 函数 ， 如 sum()、pdf()、cdf()、mean()、abs()、exchange()、 
shuffle()、isPrime() 和 tone()， 我 们 可 以 在 其 他 程序 中 直接 使 用 它们 ， 就 好 像 它 们 是 Java 中 
原生 支持 的 函数 和 功能 一 样 。 这 样 的 设计 在 很 大 程度 上 提高 了 灵活 性 ， 为 我 们 开辟 了 一 个 全 


.新 的 编程 世界 。 之 前 ， 你 可 以 将 Java 程序 看 作 一 系列 语句 的 组 合 ; 现在 ， 你 需要 将 Java 程 


序 视 为 一 组 可 以 互相 调用 的 静态 方法 。 你 已 经 习惯 使 用 的 语句 到 语句 的 控制 流 仍 然 存在 于 静 
态 方法 中 ， 只 是 程序 具有 了 更 高 级 别 的 控制 流 ， 这 个 控制 流 就 是 静态 方法 调用 和 返回 。 这 使 
得 你 能 够 根据 应 用 所 要 求 的 操作 来 思考 程序 的 设计 ， 而 不 仅仅 是 对 内 置 于 Java 中 的 基本 类 
型 的 简单 算术 运算 。 

在 编程 时 ， 要 尽 可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 任 务 ， 然 后 分 别 实现 。 本 节 中 
的 例子 (以 及 本 书后 面 的 程序 ) 清楚 地 说 明了 这 一 点 。 使 用 静态 方法 ,我们 可 以 : 

。 将 较 长 的 语句 序列 分 成 独立 的 部 分 。 

。 重复 使 用 代码 ， 而 无 须 复 制 代码 。 

。 使 用 更 高 层次 的 概念 来 设计 程序 (如 声波 )。 

这 将 生成 比 仅 由 Java 赋值 、 条 件 和 循环 语句 组 成 的 长 程序 更 易于 理解 、 维 护 和 调试 的 
代码 。 在 下 一 节 中 ， 我们 将 讨论 如 何 使 用 其 他 程序 中 定义 的 静态 方法 ， 这 会 将 我 们 带 到 一 个 
更 高 的 编程 级 别 。 
问答 环节 

问 : 如 果 我 在 定义 静态 方法 时 省 略 了 关键 字 static， 会 发 生 什么 ? 

答 : 通常 ， 回 答 这 样 的 问题 最 好 的 方法 是 自己 试 一 试 ， 看 看 会 发 生 什 么 。 下 面 是 在 
Harmonic 的 harmonic() 中 省 略 static 修饰 符 的 结果 : 

Harmonic.java:15: error: non-static method harmonic(int) 

cannot be referenced from a static context 


double value = harmonic(arg); 
和 


1 error 


非 静态 方法 与 静态 方法 不 同 。 你 将 在 第 3 章 中 了 解 到 它们 的 差异 。 

问 : 如 果 我 在 return 语句 后 编写 代码 会 发 生 什 么 ? 

答 : 一 旦 到 达 返 回 语句 ， 控 制 立即 返回 到 调用 方 ， 因 此 返回 语句 后 的 任何 代码 都 是 无 用 
的 。Java 将 此 情况 标识 为 编译 时 错误 ， 将 会 报告 : unreachable code。 

问 : 如 果 我 不 使 用 return 语句 ， 会 发 生 什 么 ? 

答 : 如 果 返 回 类 型 是 void， 则 没有 问题 。 在 这 种 情况 下 ， 控 制 流 会 在 完成 最 后 一 个 语句 
之 后 返回 调用 方 。 如 果 返 回 类 型 不 是 void， 且 有 任何 代码 执行 路 径 不 是 以 return 语句 结束 ， 
则 Java 将 报告 编译 错误 : missing return statement。 

问 : 为 什么 我 需要 使 用 返回 类 型 void ? 为 什么 不 直接 省 略 返回 类 型 ? 

答 : Java 语言 的 设计 者 就 是 这 人 么 要 求 的 ， 在 没有 返回 值 的 时 候 我 们 必须 写 上 void。 试 
图 揣测 编程 语言 设计 者 的 思路 ， 是 成 长 为 一 个 编程 语言 设计 者 迈 出 的 第 一 步 。 

问 : 我 可 以 使 用 return 语句 从 返回 类 型 为 Yoid 的 函数 返回 吗 ? 如 果 是 ， 我 应 该 使 用 哪 
个 返回 值 ? 

答 : 可 以 。 使 用 return 语句 返回 ; 没有 返回 值 。 


亏 数 和 磺 菇 129 


问 : 程序 的 副作用 和 将 数组 作为 参数 传递 的 概念 令 人 费解 。 这 部 分 真 的 那么 重要 吗 ? 

答 : 是 的 。 在 大 型 系统 中 ， 正 确 控制 程序 的 副作用 是 程序 员 最 重要 的 任务 之 一 。 花 时 间 
来 确保 你 了 解 按 值 传递 ( 当 参 数 是 基本 类 型 时 ) 和 按 引 用 传递 ( 当 参 数 是 数组 时 ) 之 间 的 区 
别 一 定 是 值得 的 。 同 样 的 机 制 也 用 于 所 有 其 他 类 型 的 数据 。 你 将 在 第 3 章 中 再 次 用 到 这 些 知 
识 ， 并且 更 加 复杂 。 

问 : 那么 ， 为 什么 不 将 所 有 的 参数 都 设计 为 按 值 传递 (包括 数组 ) 来 消除 程序 的 副 作 
用 呢 ? 

答 : 想象 一 个 巨大 的 数组 ， 比 方 说 ， 包 含 几 百 万 个 元 素 。 将 所 有 这 些 值 复制 到 一 个 静态 
方法 中 ， 而 这 个 方法 仅 用 于 交换 其 中 两 个 元 素 的 值 ， 是 否 有 意义 ? 因此 ， 大 多 数 编程 语言 在 
实现 将 数组 传递 给 函数 时 ， 都 选择 不 创建 数组 元 素 的 副本 一 一 Matlab 是 一 个 例外 。 

问 : Java 计算 方法 调用 的 顺序 是 什么 ? 

答 : 不 管 运算 符 的 优先 级 和 结合 性 是 什么 ，Java 总 是 从 左 向 右 计算 子 表达 式 (包括 方法 
调用 ) 和 参数 列表 。 例 如 ， 在 计算 表达 式 

f10+f2() * f3(f4(), £50) 
时 , Java 的 调用 顺序 是 f10、f20、f40、f50 和 BQ()。 这 对 那些 能 产生 副作用 的 方法 至 关 重 要 。 
作为 一 种 良好 的 编程 风格 ， 我 们 应 该 避免 编写 依赖 于 计算 顺序 的 代码 。 


练习 


2.1.1 编写 一 个 静态 方法 max3(0)， 它 需要 输入 3 个 int 参 数 并 返回 最 大 值 。 添 加 一 个 重 载 函数 ,为 3 
个 double 值 做 同样 的 事情 。 

2.1.2 ”编写 一 个 静态 方法 odd0， 它 需要 输入 3 个 boolean 参数 ， 如 果 参 数值 中 有 奇数 个 为 true ( 即 1 
个 或 3 个 )， 返回 true， 否 则 为 false。 

2.1.3 ”编写 一 个 静态 方法 majority()， 需 要 输入 3 个 boolean 参数 ， 如 果 至 少 有 两 个 参数 值 为 true， 则 
返回 true， 否 则 为 f@lse。 不 要 使 用 让 语句 。 

2.1.4 ”编写 一 个 静态 方法 eq0， 它 将 两 个 int 数组 作为 参数 ， 如 果 数 组 具有 相同 的 长 度 且 所 有 对 应 的 元 
素 对 相等 ， 则 返回 true， 否 则 为 false。 

2.1.5 编写 一 个 静态 方法 areTriangular()， 它 需要 输入 3 个 double 型 参数 ， 如 果 它 们 可 以 是 三 角形 的 
边 〈 任 意 一 边 小 于 其 余 两 边 之 和 )， 则 返回 true。 请 参阅 练习 1.2.15。 

2.1.6 ”编写 一 个 静态 方法 sigmoid()， 它 需要 输入 一 个 double 参数 x 并 返回 从 公式 1/(1+e”) 获得 的 
double 值 。 

2.1.7 编写 一 个 静态 方法 sqgrt()， 它 需要 输入 一 个 double 参数 并 返回 该 数字 的 平方 根 。 使 用 牛顿 方法 
(参见 程序 1.3.6 ) 来 计算 结果 。 

2.1.8 给 出 Java 函数 “Harmonic 3 5” 的 调用 轨迹 。 

2.1.9 ”编写 一 个 静态 方法 lg0， 需 要 输入 一 个 double 参数 n 并 返回 n 的 以 2 为 底 的 对 数 。 你 可 以 使 用 
Java 的 数学 库 Math。 

2.1.10 ”编写 一 个 静态 方法 lg0， 它 需要 输入 一 个 int 参数 n， 并 返回 不 大 于 n 的 以 2 为 底 的 对 数 的 最 

大 整数 。 不 要 使 用 Math 库 。 
2.1.11 编写 一 个 静态 方法 signum0， 它 需要 输入 一 个 int 参数 n : 如 果 n 小 于 0， 则 返回 -1 ; 如 果 n 
等 于 0， 则 为 0; 如 果 n 大 于 0， 则 为 +1。 
2.1.12 思考 下 面 的 静态 方法 duplicate()。 
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public static String duplicate(String s) 
{ 

Stringt = s+s; 

return t; 


} 
下 面 的 代码 片段 执行 什么 操作 ? 


StMmnges = "Helions 

s = duplicate(s); 

String t = "Bye”,; 

t = duplicate(duplicate(duplicate(t))); 
StdOut.printin(s + 七 ) ; 


思考 下 面 的 静态 方法 cube()。 


public static void cube(int i) 
{ 
| 


} 


下 面 的 循环 迭代 的 次 数 是 多 少 ? 
for (Cint 1 = 0; i < 1000; i++) 
cube(i); 


答案 : 一 定 是 1000 次 。 对 cube() 的 调用 对 调用 者 端 代码 没有 影响 。 它 更 改 其 局 部 参数 变 
量 i 的 值 ， 但 该 更 改 对 for 循环 中 的 i 没有 影响 ， 这 是 两 个 不 同 的 变量 。 如 果 你 使 用 语句 i=i * 
i*i 替换 对 cube (i) 的 调用 (可 能 这 就 是 你 正在 想 的 )， 那 么 循环 迭代 5 次 ，i 在 这 5 次 迭代 开 
始 时 取 值 分 别 是 0、1、2、9 和 730。 

以 下 校 验 和 公式 在 银行 和 信用 卡 公司 广泛 使 用 ， 用 来 验证 账号 的 合法 性 : 
dotftdi)+ds+ftds)+dstftds)+:…=0(mod 10) 

di 是 账号 数 的 十 进 制 数 的 第 i 位 ,fta) 是 24 的 十 进 制 数 的 各 位 数字 总 和 (例如 ,fA7)=5， 
因为 2X7=14 和 1 十 4=5)。 例 如 ，17327 是 有 效 的， 因为 1+5+3+4+7=20， 是 10 的 整数 倍 。 
请 实现 函数 /， 并 编写 一 个 程序 ， 接 收 一 个 10 位 整数 作为 命令 行 参数 ， 输 入 一 个 11 位 的 有 效 
账号 ( 即 符合 上 面 的 校 验 和 计算 规则 的 账号 一 一 译 者 注 )。 账 号 的 第 11 位 是 一 个 校 验 位 ， 由 给 
定 的 前 10 位 数字 计算 得 到 。 

给 定 两 颗 星 星 ， 其 赤 纬 (declination) 和 赤 经 (right ascension) 位 置 分 别 是 (di, a1) 和 (qd, a;)， 
它们 的 相对 角度 计算 公式 是 : 
2 arcsin((sin’(d/2)+cos (di)cos(d;)sin’(a/2))) 

其 中 ai 和 az 的 取 值 范围 是 -180。 和 180。 之 间 的 角度 ，d! 和 4d, 的 取 值 范围 是 -90” 和 
90。 之 间 的 角度 ，a=a2-al 且 d=d;-d1。 编 写 一 个 程序 ， 将 二 星 的 赤 纬 和 赤 经 位 置 作为 命令 行 
参数 ， 并 打印 它们 的 相对 角度 。 提 示 : 注意 需要 从 角度 转换 为 弧度 。 

写 一 个 静态 方法 scale()， 它 需要 输入 一 个 double 型 数组 作为 参数 ， 它 的 副作用 是 将 数组 中 的 
每 个 元 素 缩放 到 0 和 1 之 间 (每 个 元 素 减 去 最 小 值 ， 然 后 除 以 最 小 和 最 大 值 之 间 的 差 )。 使 用 
本 书 表格 中 定义 的 max() 方法 ， 并 编写 和 使 用 相应 的 min() 方法 。 

编写 一 个 静态 方法 reverse()， 它 需要 输入 一 个 字符 串 数组 作为 其 参数 ， 它 会 创建 一 个 新 数组 ， 
并 使 其 中 的 元 素 以 原来 数组 元 素 相反 的 顺序 排列 ， 返 回 这 个 新 数组 〈 不 要 更 改 参数 数组 中 字符 
串 的 顺序 )。 再 编写 一 个 静态 方法 reverseInplace(0)， 它 采用 一 个 字符 串 数 组 作为 其 参数 ， 并 反 
转 参 数 数组 中 字符 串 顺 序 。 
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编写 一 个 静态 方法 readBoolean2D()， 它 从 标准 输入 读 取 二 维 boolean 型 矩阵 〈 带 有 维度 )， 并 
返回 生成 的 二 维 数组 。 

编写 一 个 静态 方法 histogram()， 它 使 用 int 型 数组 a[] 和 整数 m 作为 参数 ， 并 返回 一 个 长 度 为 
m 的 数组 ， 其 第 i 个 元 素 是 i 出 现在 af] 中 的 次 数 。 假 设 af] 中 的 值 都 在 0 和 m-1 之 间 ， 则 返 
回 数组 中 的 值 之 和 应 等 于 a.length。 

结合 本 节 和 1.4 节 中 的 代码 片段 ， 开 发 一 个 程序 ， 该 程序 需要 输入 整数 命令 行 参数 n， 从 随机 
混 排 的 卡 券 盒 中 抽取 n 手 牌 ， 每 手 5 张 。 打 印 这 n 手 牌 的 内 容 ， 其 中 每 张 牌 占 一 行 ， 打 印 牌 
的 名 称 ， 类 似 于 “Ace of Clubs”， 每 手 牌 之 间 以 空白 行 分 隔 。 

写 一 个 静态 方法 multiply0， 它 需要 输入 两 个 参数 维度 相同 的 方 阵 作为 参数 ， 求 它们 的 乘积 
(结果 是 一 个 相同 维度 的 矩阵 )。 加 分 题 : 确保 第 一 个 矩阵 中 的 列 数 等 于 第 二 个 矩阵 中 的 行 数 。 
编写 一 个 静态 方法 any0， 它 需要 输入 一 个 boolean 型 数组 作为 参数 ， 如 果 数 组 中 的 任 一 元 素 
为 true， 则 返回 true， 和 否则 返回 false。 编 写 一 个 静态 方法 all0 ， 它 需要 输入 一 个 boolean 型 数 
组 作为 参数 ， 如 果 数 组 中 的 所 有 元 素 均 为 true， 则 返回 tue， 否 则 返回 false。 

开发 一 个 版 本 的 getCoupon()， 以 模拟 有 一 张 较为 军 见 的 卡 券 的 情况 : 随机 选择 一 个 n 值 ， 以 
1/( 1000n) 的 概率 返回 该 值 ， 以 相同 概率 返回 其 他 值 。 加 分 题 : 这 种 变化 对 卡 券 收 集 时 所 需 
拿 到 的 卡 券 平 均值 有 什么 影响 ? 

修改 PlayThatTune， 为 每 个 音符 全 加 与 原来 的 音符 相隔 两 个 八 度 的 和 声 ， 这 两 个 和 声 的 权重 
都 设置 为 原 一 个 八 度 和 声 的 一 半 。 
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生日 问题 。 开 发 一 个 类 ， 其 中 包含 若干 个 适当 的 静态 函数 ， 用 以 研究 生日 问题 (参见 练习 1.4.38 )。 
欧 拉 函数 。 欧 拉 函 数 是 数论 中 的 重要 函数 : p(n) 被 定义 为 小 于 或 等 于 n 的 数 中 与 n 互 质 的 数 的 
数目 ( 即 与 n 之 间 除 了 1 之 外 没有 其 他 公 因 子 )。 编 写 一 个 类 并 实现 一 个 静态 方法 ， 它 需要 输 
人 一 个 整数 参数 n 并 返回 p(n)， 然后 编写 一 个 main() 函数 ， 它 需要 输入 一 个 整 型 命令 行 参数 ， 
用 这 个 参数 调用 该 方法 ， 并 打印 结果 值 。 
谐 波 数 。 编 写 一 个 程序 Harmonic， 其 中 包含 三 个 静态 方法 harmonic0、harmonicSmallO 和 harmonicLarge() 
来 计算 谐 波 数 。harmonicSmall() 方法 应 该 只 计算 累加 和 (如 程序 1.3.5 )，harmonicLarge() 方法 
使 用 近似 公式 =loge(n)+y+1/2n-1/(12n”)+1/(120n1) (y=0.577215664901532…， 称 为 欧 拉 常数 )， 
当 n<100 时 ，harmonic() 方法 应 该 调用 harmonicSmall()， 否 则 调用 harmonicLarge()。 
布莱克 一 斯 克 尔 斯 期 权 估 价 。 布 莱克 - 斯 克 尔 斯 公式 为 欧洲 认购 非 股 息 的 股票 期 权 提供 了 理 
论 基 础 。 假 定 当前 股票 价格 *， 执 行 价格 x， 连 续 复 合 无 风险 利率 >， 波 动 率 c 和 成 熟 期 (年 ) t。 
布 菜 克 - 斯 克 尔 斯 值 由 公式 * 理 (oO)-xe“@(D) 给 出 ， 其 中 @(z) 是 高 斯 累积 分 布 函数 ，a=(ln (s/ 
x)+(r+oz2)D/c ft ), b=a-o ft 。 编写 一 个 程序 ， 从 命令 行 中 获取 s、r、o 和 +t， 并 打印 布莱克 - 
斯 克 尔 斯 值 。 
传 里 叶 峰 值 。 编 写 一 个 程序 ， 需 要 输入 命令 行 参 数 n 并 绘制 函数 
(cos(f)+cos(2t)+cos(3f)+:*…*+cos(nt))/n 

从 -10 到 10 (以 弧度 表示 ) 之 间 取 500 个 相同 间隔 的 + 样本 s 令 n=5 和 n=500 时 ， 运 行 
你 的 程序 。 注 意 : 你 将 观察 到 总 和 收敛 到 一 个 尖峰 (除了 单个 地 方 有 值 ， 其 他 地 方 都 是 0 )。 
该 属性 可 以 用 于 证 明 任何 平滑 函数 可 以 表示 为 正弦 曲 线 的 累加 和 。 
日 历 。 编 写 一 个 程序 日 历 ， 它 需要 输入 两 个 整 型 命令 参数 m 和 y， 并 打印 年 度 y 的 第 m 月 的 
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日 历 ， 如 以 下 示例 所 示 : 


% java Calendar 2 2009 
February 2009 
S_ M Tus WM-T 
ny dB} 


nopp 
DPpp 


h 
5 
2 
9 
6 


NOWwmT 
oPPANO 


出 
2 


No 


1 
2 


wu oO 
DpPp 
NO 
Np 
JU N 上 
FU ID 上 


提示 : 请 参见 程序 LeapYear (程序 1.2.4 ) 和 练习 1.2.29。 
霍 纳 方法 。 编 写 一 个 类 Horner 并 实现 一 个 方法 evaluate()， 该 方法 使 用 浮 点 数 x 和 数组 p[] 作 
为 参数 ， 计 算 其 系数 为 p[] 的 x 的 多 项 式 的 值 并 返回 计算 结果 ， 多 项 式 如 下 : 
p(x)=potpix tp 二 Di HP 
霍 纳 方法 是 以 上 多 项 式 的 一 种 有 效 计算 方法 ， 即 按照 以 下 公式 完成 对 上 述 多 项 式 的 计算 : 
PC)=Po+HX(DIHX(D2 二 +X(Dn-2TXPDn-D))…) 

编写 一 个 测试 用 客户 端 静态 方法 exp()， 该 方法 使 用 evaluate() 来 计算 e 的 近似 值 ， 你 可 
以 使 用 泰勒 级 数 扩展 e 三 1+x/1!1+x”/2!1+x/3!+… 的 前 n 项 来 实现 计算 任务 。 你 的 客户 端 程序 应 该 
需要 输入 命令 行 参数 x， 并 将 其 结果 与 Math.exp (x) 计算 结果 进行 比较 。 
和 弦 。 开 发 一 个 可 以 处 理 和 弦 (包括 和 声 ) 的 歌曲 的 PlayThatTune。 开 发 一 种 输入 格式 ， 人 允许 
你 为 每 个 和 弦 指 定 不 同 的 持续 时 间 ， 并 为 和 弦 中 的 每 个 音符 指定 不 同 的 权重 。 通 过 各 种 和 声 
和 和 弦 的 测试 文件 来 测试 你 的 程序 ， 并 用 它 来 尝试 演奏 《 致 爱丽 丝 》。 
本 福 德 定律 。 美 国 天 文学 家 西蒙 . 纽 科 姆 ( Simon Newcomb) 在 一 本 对 数 表 (对 数 表 是 在 计算 
机 出 现 之 前 常用 于 求 对 数值 的 工具 书 一 一 译 者 注 ) 中 观察 到 了 一 个 奇怪 的 现象 : 开始 页 面 比 
结尾 页 面 要 脏 得 多 。 他 怀疑 科学 家 在 计算 过 程 中 ,用 1 开始 的 数字 ,要 比 用 8 或 者 9 开始 的 
数字 多 很 多 ， 并 且 推 测 在 一 般 情况 下 ， 以 1 为 首位 数字 的 数 的 出 现 概 率 ( 近 30%) 远 比 以 9 开 
始 的 数字 的 出 现 概率 ( 少 于 4%) 要 大 。 这 种 现象 被 称 为 本 福 德 定律 ， 现 在 经 常用 作 统 计 检验 。 
例如 ， 国 税 局 法 务 会 计 师 依靠 它 来 发 现 税务 欺诈 。 编 写 一 个 程序 ， 将 这 一 过 程 分 解 为 一 组 静 
态 方法 ， 从 标准 输入 读 入 整数 序列 ， 并 列 出 1 一 9 每 个 数字 作为 首位 数字 的 次 数 。 使 用 你 的 程 
序 来 测试 计算 机 或 网 络 上 的 一 些 信息 表 ， 看 它们 是 否 遵从 这 一 法 则 。 然 后 ， 编 写 一 个 程序 ， 
通过 生成 从 $ 1.00 到 $ 1,000.00 的 随机 金额 ， 遵 从 相同 的 概率 分 布 ， 看 你 是 否 能 以 此 打败 国税 
局 (IRS)。 
二 项 分 布 。 写 一 个 函数 : 


public static double binomial(int n, int k, double p) 


用 如 下 公式 计算 : n 次 独立 重复 的 丢 硬 币 试验 中 出 现 k 次 正面 的 概率 (假设 正面 出 现 的 概 

率 是 p) 
fln,kp)=p'(1-p)"* nl/(k!(n-A)!) 

提示 : 为 了 避免 溢出 ， 计 算 x=laftn,kp)， 然后 返回 ee。 在 main() 中 ， 从 命令 行 中 取 半 和 
pP， 并 检查 对 于 所 有 的 取 值 (在 0 和 nn 之 间 ) 的 概率 总 和 是 否 为 1 (或 近似 为 1)。 此 外 ,将 
计算 的 结果 与 正 态 分 布 的 近似 值 相 比较 

fln,kp)T $ (np,np(1-7)) 

( 见 练习 2.2.1 )。 
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2.1.35 ”基于 二 项 分 布 的 卡 券 收集 。 开 发 一 个 新 的 getCoupon() 版 本 ,使 用 前 面 练习 中 的 binomial()， 
根据 p=1/2 的 二 项 分 布 返 回 卡 券 值 。 提 示 : 生成 一 个 0 到 1 之 间 的 随机 数 x， 然 后 返回 满足 下 
列 条 件 的 最 小 的 k: 对 于 所 有 的 j<k，ftnyj,p) 之 和 大 于 x。 加 分 题 : 在 此 假设 条 件 下 ， 尝 试 描 
述 卡 券 收集 函数 的 行为 。 

2.1.36 ”邮政 条 码 。 美 国 邮政 系统 用 于 邮寄 邮件 的 条 形 码 遵循 如 下 规则 : 邮政 编码 (ZIP 码 ) 中 的 每 个 
十 进 制 数字 编码 由 3 个 半 长 、2 个 整 长 的 条 码 组 成 。 条 形 码 以 整 长 的 条 码 开 始 ， 以 整 长 的 条 码 
结束 ， 并 包含 校 验 和 数字 ( 跟 在 第 5 位 ZIP 码 或 ZIP+4 之 后 )， 校 验 和 数字 是 原始 数字 之 和 除 
以 10 的 余数 。 请 定义 函数 实现 以 下 功能 : 
。 在 StdDraw 上 绘制 半 长 或 整 长 的 条 码 。 
。 给 定 一 个 数字 ， 绘 制 它 的 条 码 。 
。 计算 校 验 和 数字 。 

还 要 实现 一 个 测试 客户 端 ， 它 读 取 一 个 5 位 (或 9 08540 JI 

位 ) 数字 的 邮政 编码 作为 命令 行 参数 ， 并 绘制 相应 的 站 站 其 0 有 有 全 0 放生 癌 
邮政 条 码 。 校 验 和 数字 
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迄今 为 止 ， 你 所 写 的 程序 都 只 是 存在 于 单个 .java 文件 中 的 Java 代码 。 而 对 于 大 型 程 
序 , 将 所 有 代码 保存 在 单个 文件 中 ， 这 种 方式 存在 着 很 多 限制 ， 而 且 也 没有 必要 这 么 做 。 幸 
运 的 是 ,在 Java 中 ， 引 用 在 另 一 个 文件 中 定义 的 方法 非常 容易 。Java 的 这 种 能 力 对 我 们 的 
编程 风格 有 两 个 重要 的 影响 。 

首先 ， 它 使 代码 复 用 (code reuse) 成 为 可 能 。 一 个 程序 可 以 通过 引用 ， 来 使 用 已 经 编写 
和 调试 过 的 代码 ， 而 不 必 复 制 代码 。 定 义 可 重复 使 用 的 代码 的 能 力 ， 是 现代 编程 的 重要 组 成 
部 分 。 这 相当 于 扩展 Java 一 一 你 可 以 定义 和 使 用 你 自己 的 数据 操作 。 

其 次 ， 它 实现 了 模块 化 编程 ( modular programming)。 你 不 仅 可 以 如 2.1 节 所 述 ， 将 程 
序 分 成 静态 方法 ， 还 可 以 将 这 些 方法 保存 在 不 同 的 文件 中 ， 并 根据 应 用 程序 的 需要 进行 分 
组 。 模 块 化 编程 非常 重要 ， 因 为 它 人 允许 我 们 独立 地 开发 、 编 译 和 调试 一 个 大 型 程序 的 每 个 部 
分 ， 并 将 每 个 完成 的 代码 块 放 在 它 自 己 的 文件 中 以 备 以 后 使 用 ， 而 无 须 再 担心 其 细节 。 我 们 
可 以 开发 静态 方法 库 以 供 其 他 程序 使 用 ， 将 它们 保存 在 本 身 的 文件 中 ， 并 且 可 以 在 其 他 程序 
中 使 用 这 些 方法 。 你 已 经 使 用 过 的 例子 有 Java 的 Math 库 和 我 们 用 于 输入 /输出 的 Std* 库 。 
更 重要 的 是 ， 你 很 快 就 能 发 现 定义 自己 的 库 也 非常 容易 。 定 义 库 并 且 在 多 个 程序 中 使 用 它们 
的 能 力 是 我 们 构建 程序 来 实现 复杂 任务 的 能 力 的 关键 组 成 部 分 。 

刚刚 在 2.1 节 中 ， 我 们 从 把 Java 程序 当 作 一 系列 语句 ， 转 换 到 了 把 Java 程序 当 作 一 个 
包含 了 一 组 静态 方法 (其 中 一 个 是 main()) 的 类 。 在 本 节 ， 你 要 做 好 准备 把 Java 程序 看 作 一 
组 类 〈class)， 每 个 类 都 是 由 一 组 方法 组 成 的 独立 模块 。 由 于 每 个 方法 都 可 以 调用 另 一 个 类 
中 的 方法 ， 所 以 所 有 代码 都 可 以 互相 调用 来 进行 交互 ， 并 且 组 合 在 一 起 形成 一 个 复杂 的 网 。 
通过 这 种 能 力 ， 你 可 以 考虑 在 编程 时 通过 将 编程 任务 分 解 为 可 独立 实施 和 测试 的 类 ， 来 降低 
编程 的 复杂 程度 。 

在 其 他 程序 中 使 用 静态 方法 ”要 在 一 个 类 中 调用 另 一 个 类 定义 的 方法 ， 我 们 可 以 使 用 调 
用 Math.sqrt() 和 StdOut.println0) 等 方法 一 样 的 机 制 : 

。 使 两 个 类 都 可 以 被 Java 访问 (例如 ， 将 它们 都 放 在 你 的 计算 机 中 的 同一 目录 中 )。 
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。 想 要 调用 一 个 方法 ， 需 要 在 这 个 方法 名 的 前 面 加 上 其 类 名 ， 并 用 一 个 点 号 做 分 隔 符 。 

举例 来 说 ， 我 们 希望 编写 一 个 简单 的 客户 端 SATjava， 它 从 命令 行 获取 SAT 分 数 >， 
并 打印 指定 年 份 中 得 分 小 于 z 的 学 生 的 百分比 (假设 这 一 年 的 平均 分 数 为 1019， 标 准 差 是 
209 )。 要 实现 这 个 功能 ，SAT.java 需要 计算 @((z-1019)/209)， 这 一 步 适合 调用 Guassian. 
java 中 的 cdf() 方 法 实现 。 我 们 现在 只 需要 将 Gaussian.java 放 在 和 SAT.java 相 同 的 目录 
下 ,并 且 在 调用 cdf() 时 指定 好 类 名 。 男 外 ， 这 个 目录 下 的 任何 其 他 方法 都 可 以 通过 类 似 
Gaussian.pdf() 或 Gaussian.cdf() 这 样 的 形式 使 用 定义 在 Gaussian 中 的 静态 方法 。 在 Java 中 ， 
Math 库 总 是 可 以 被 访问 ， 因 此 任何 类 都 可 以 调用 Math.sqrtO0 和 Math.expO0s。 文件 Gaussian. 
java、SAT.java 和 Math.java 中 各 自 实现 了 一 个 Java 类 ， 并且 类 之 间 存 在 交互 : SAT 调用 了 
Gaussian 中 的 一 个 方法 ， 这 个 方法 又 接着 调用 Math 中 的 两 个 方法 。 

定义 多 个 文件 ， 每 个 文件 都 是 包含 多 个 方法 的 独立 类 ， 这 样 的 编程 访 式 带 来 的 潜在 效果 
是 又 一 次 深刻 改变 了 我 们 的 编程 风格 。 通 常 ， 我 们 把 这 种 方法 称 为 模块 化 编程 。 我 们 在 一 次 应 
用 中 开发 并 调试 了 一 些 方法 ， 就 可 以 在 以 后 的 任何 时 间 调 用 它们 。 在 这 一 节 中 ， 我 们 将 通过 许 
多 例子 来 帮助 你 理解 并 熟悉 这 个 思路 。 然 而 ， 在 举例 之 前 ， 我 们 需要 讨论 几 个 流程 的 细节 。 






% python gaussiantable.py 1019 209 





| 





Gaussian.java 





SAT. java 













fpublic static double cdf(double z) 
{ 





Ake 


i 
rgs) 





public static void main(String[] a if (z < -8.0) return 0.0; 
if (z > 8.0) return 1.0; 

double sum = 0.0; 

double term = Zz; 

for (int i = 3; sum != sum + term; i += 2) 







double z = Double.pa 


.parseDouble(args[0]); 
Gayssian.cdf((z - 1019)/209) ; 矿 


sum = Sum + term; 
term = term * Zz*ZzZ/i 





bo a ， 
ic static double pdf(double x) ” 







ea i 






public static double sqrt(double x) 
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© 请 注意 图 的 左上 角 那 里 原 书 中 有 错误 。 那 一 行 python 命令 应 该 是 java SAT1019 209。 一 一 译 者 注 
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关键 字 public。 自 HelloWorld 以 来 ,我 们 一 直 在 每 个 静态 方法 前 都 标识 了 一 个 关键 字 
public， 这 一 修饰 语 表示 该 方法 可 供 任何 其 他 可 访问 该 文件 的 程序 使 用 。 你 也 可 以 将 方法 标 
识 为 private (还 有 其 他 几 个 类 别 ), 但 是 你 现在 没有 理由 这 样 做 。 我 们 将 在 3.3 节 讨 论 这 些 标 
识 的 含义 。 

每 个 模块 都 是 一 个 类 (class)。 我 们 使 用 术语 模块 (module) 来 指 代 我 们 保存 在 单个 文 
件 中 的 所 有 代码 。 按 照 惯例 ，Java 中 的 每 个 模块 都 是 一 个 Java 类 (class)， 保存 这 个 类 的 代 
码 的 文件 名 应 该 与 类 名 相同 且 扩 展 名 是 .java。 在 本 章 中 ， 每 个 类 只 是 一 系列 静态 方法 (其 中 
一 个 是 main())。 你 将 在 第 3 章 中 学 习 更 多 的 Java 类 的 常用 结构 。 

.class 文件 。 当 你 编译 程序 (通过 键入 javac 后 跟 类 名 称 ) 时 ，Java 编译 器 将 创建 一 个 
以 类 名 命名 的 文件 ， 后 跟 .class 扩展 名 ， 这 个 文件 用 更 适合 计算 机 理解 的 语言 存储 着 你 的 代 
码 。 如 果 你 有 一 个 .class 文件 ， 即 使 没有 相应 的 .java 文件 中 的 源 代码 ， 你 也 可 以 在 另 一 个 
程序 中 使 用 该 模块 的 方法 〈 但 是 如 果 你 发 现 了 一 个 代码 中 的 bug， 则 会 束手无策 ! )。 

需要 时 再 编译 。 当 你 编译 一 个 程序 时 ，Java 通常 会 编译 所 有 能 够 让 这 个 程序 正常 运行 
的 部 分 。 如 果 你 在 SAT 中 调用 Gaussian.cdf()， 然 后 当 你 输入 javac SAT.java 时 ， 编 译 器 将 
检查 自 上 次 被 编译 至 今 ，Gaussian.java 是 否 被 修改 (通过 比较 Gaussian.java 上 次 被 修改 的 
时 间 和 Gaussian.class 创建 的 时 间 来 实现 )。 如 果 它 被 修改 了 ， 它 也 会 重新 编译 Gaussian. 
java ! 仔细 思考 这 个 方式 ， 你 会 觉得 它 是 一 个 非常 有 用 的 方案 。 毕 竟 如 果 你 在 Gaussian. 
java 中 发 现 了 一 个 bug (然后 修复 了 它 )， 你 会 希望 所 有 调用 这 个 方法 的 类 都 使 用 最 新 的 这 个 
版 本 。 

多 个 main() 方法 。 另 一 个 需要 注意 的 微妙 问题 是 : 可 能 不 止 一 个 类 包含 main() 方法 。 
在 我 们 的 例子 中 ，SAT 和 Gaussian 都 有 它们 自己 的 main( 方法。 如 果 你 回想 一 下 运行 程 
序 的 规则 ， 你 会 发 现 这 里 不 存在 混淆 : 当 你 输入 java 后跟 一 个 类 名 ，Java 将 控制 转移 到 这 
个 类 定义 的 main0 方法 的 机 器 码 上 。 通 常 我 们 在 每 个 类 中 都 定义 一 个 main() 函数 用 于 测 
试 和 调试 这 个 类 的 方法 。 当 我 们 想 要 运行 SAT 时 ， 我们 输入 java SAT ; 当 我 们 想 要 调试 
Gaussian 时 ， 我 们 输入 java Gaussian (加 上 合适 的 命令 行 参数 )。 

如 果 你 写 的 每 个 程序 都 可 以 在 别 的 编程 任务 中 发 挥 作用 ， 很 快 你 就 会 发 现 自己 有 了 各 种 
有 用 的 工具 。 模 块 化 编程 使 得 我 们 可 以 把 以 往 开 发 的 任何 计算 问题 的 解决 方案 都 看 作 后 续 编 
程 的 资源 ， 随 时 可 以 用 在 新 的 计算 任务 当中 。 

举例 来 说 ， 假 设 你 将 来 在 某 个 应 用 程序 中 需要 计算 中 ， 为 何不 直接 剪 切 和 粘贴 
Gaussian 中 实现 cdf0 的 代码 ? 虽然 这 是 可 行 的 ， 但 是 会 使 你 有 两 份 同样 的 代码 ， 从 而 代码 
的 维护 变 得 困难 。 如 果 之 后 你 想 修 改 或 者 改进 这 份 代码 ， 你 将 需要 在 两 份 代码 中 做 同样 的 工 
作 。 作 为 替代 ， 你 可 以 直接 调用 Gaussian.cdf()。 我 们 自己 实现 的 方法 和 使 用 自己 的 方法 都 
会 越 来 越 多 ， 所 以 只 维护 一 份 代码 是 一 个 值得 追求 的 目标 。 

从 这 一 点 出 发 ， 你 写 每 一 个 程序 时 ， 都 应 该 找到 合理 的 方法 ， 把 计算 工作 分 成 大 小 便 
于 管理 的 几 个 独立 部 分 ， 并且 在 实现 每 个 部 分 的 时 候 ， 都 要 做 好 以 后 给 别人 使 用 它 的 准备 。 
最 常见 的 是 这 个 别人 一 般 就 是 你 自己 ， 你 会 感激 自己 省 下 了 重新 开发 或 者 重新 调试 代码 的 
珊 夫 5 

库 我们 把 其 中 包含 的 方法 主要 用 于 供 其 他 程序 使 用 的 模块 叫 作 库 (library)。Java 中 
最 重要 的 编程 特性 之 一 就 是 为 了 方便 用 户 使 用 ， 预 定义 了 成 千 上 万 个 库 。 我 们 会 在 本 书 中 有 
选择 地 介绍 一 些 你 可 能 会 感 兴趣 的 库 ， 但 是 我 们 不 会 深入 Java 库 的 设计 细节 ， 因 为 这 些 库 
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中 的 很 多 是 专 为 有 经 验 的 程序 员 而 设计 的 。 我 们 将 把 本 章 的 重心 放 在 更 重要 的 用 户 自 定 义 库 
(user-defined libraries) 上 ， 自 定义 库 就 是 一 些 用 户 自 定 义 的 类 ， 其 中 包含 了 一 组 供 其 他 程序 
使 用 的 相关 方法 。 任 何 一 个 Java 库 都 不 能 包含 我 们 计算 所 需要 的 所 有 库 ， 因 此 创建 我 们 自 
己 的 方法 库 是 解决 复杂 编程 问题 的 关键 步骤 。 

客户 。 我 们 使 用 术语 客户 ( client) 来 表示 调用 指定 库 方法 的 程序 。 当 一 个 类 A 中 包含 
的 一 个 方法 调用 了 男 一 个 类 B 中 的 方法 时 ,我 们 把 类 A 叫 作 类 B 的 客户 。 在 我 们 的 例子 中 ， 
SAT 是 Gaussian 的 一 个 客户 。 一 个 类 可 能 有 多 个 客户 。 举例 来 说 ， 所 有 你 写 的 调用 了 Math. 
sqrt() 或 者 Math.random() 的 程序 都 是 Math 的 客户 。 

应 用 程序 编程 接口 (API)。 通常 ， 程 序 员 认 为 在 客户 和 方法 的 具体 实现 描述 之 间 存 在 着 
契约 (contract)。 当 客户 和 实现 都 是 由 你 实现 时 ， 你 在 和 你 自己 定 下 契约 ,契约 本 身 非 常 实 
用 ， 因 为 它 为 调试 提供 了 额外 的 帮助 。 更 重要 的 是 ， 这 种 形式 促进 了 代码 的 复 用 。 实 际 上 ， 
你 已 经 编写 的 很 多 程序 基本 都 是 Std* 、Math 和 其 他 内 置 Java 类 的 客户 。 这 得 益 于 那些 非 正 
式 的 契约 (用 我 们 可 以 理解 的 语言 准确 地 描述 了 这 些 类 ，; 窜 户 
和 方法 的 功能 ) 以 及 对 这 些 方 法 的 签名 的 确切 描述 。 这 | 
些 信息 总 体 上 被 称 为 应 用 程序 编程 接口 ( Application . 
Programming Interface, API) 。 而 对 于 用 户 自 定义 库 ， 这 
种 机 制 也 是 有 效 的 。API 使 得 任何 客户 可 使 用 库 ， 而 无 
须 关 心 代码 的 具体 实现 ， 正 如 你 在 使 用 Math 和 Std* 时 
那样 。API 设计 的 指导 原则 是 仅 向 客户 提供 他 们 需要 的 


Gaussian.pdf(x) 





调用 库 方法 
API 


public class Gaussian 


方法 。 具 有 大 量 方 法 的 API 在 实现 程序 上 可 能 是 负担 ; double pdf(double x) 











(x) 

而 缺少 重要 方法 的 API 对 客户 来 说 则 可 能 不 够 方便 。 Ee 
实现 。 我 们 用 术语 实现 (implementation) 来 描述 定义 匡 数 等 名 
实现 API 中 方法 的 Java 代码 ， 它 通常 保存 在 以 库 名 称 并 描述 库 方法 


命名 的 :java 文件 中 。 每 个 Java 程序 都 是 一 些 API 的 实 
现 ， 脱 离 了 实现 的 API 是 毫 无 用 处 的 。 当 我 们 试图 为 
API 提 供 实 现时 ， 我 们 的 目标 是 遵守 契约 ， 即 保证 API 


的 函数 功能 保持 不 变 。 在 通常 情况 下 ， 对 于 同一 个 API 
可 以 有 许多 种 实现 方法 ， 因 为 我 们 分 离 了 客户 代码 与 实 at 
现代 码 ， 因 此 可 以 自由 地 替换 代码 以 改进 API 的 实现 。 


举例 来 说 ， 对 于 我 们 前 面 经 常用 到 的 高 斯 分 布 函数 ， “go | | 


这 些 函 数 不 在 Java 的 Math 库 中 , 但 在 实际 应 用 中 很 重 





要 ， 因 此 我 们 把 它们 放 在 一 个 库 中 ,这 样 它们 就 可 以 在 ee. 
将 来 被 客户 程序 访问 。 以 下 是 对 此 API 的 精准 描述 : Pe 
public class Gaussian 
double pdf(double x) 中 0 
double pdf(double x, double mu, double sigma) 中 心 ， 陋 o) 
double cdf(double z) 中 (z) 
double cdf(double z, double mu, double sigma) DB, ba) 


高 斯 分 布 函数 的 静态 方法 库 的 API 
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此 API 不 仅 包括 单 参数 的 高 斯 分 布 函 数 ( 见 程序 2.1.2 )， 而且 还 包括 在 许多 统计 应 用 中 
出 现 的 三 参数 版 本 (客户 指定 分 布 的 平均 值 和 标准 偏差 )。 三 参数 高 斯 分 布 函数 的 实现 很 简 
单 (参见 练习 2.2.1 )。 

API 应 包含 多 少 信息 ?” 这 是 程序 员 和 计算 机 科学 教育 工作 者 中 的 一 个 灰色 地 带 ， 也 是 一 
个 被 激烈 辩论 的 问题 。 我 们 可 能 尝试 在 API 中 提供 尽 可 能 多 的 信息 ， 但 是 (与 任何 契约 一 
样 ! )， 我 们 可 以 有 效 地 包含 的 信息 量 是 有 限 的 。 在 本 书 中 ,我 们 坚持 一 个 与 我 们 的 指导 性 设 
计 原 则 相符 的 原则 : 仅仅 向 客户 程序 员 提 供 他 们 所 需要 的 信息 。 相 比 于 提供 有 关 实 现 的 详细 
信息 的 方案 ， 这样 做 可 以 给 我 们 更 强 的 灵活 性 。 事 实 上 ， 任何 额外 的 信息 相当 于 隐蔽 地 扩展 
了 契约 ， 这 是 不 必要 的 。 许 多 程序 员 陷 入 分 析 实 现代 码 的 坏 习 惯 中 ， 试 图 了 解 它 的 作用 。 这 
样 做 可 能 导致 客户 代码 依赖 于 某 些 未 在 API 中 明确 指定 的 行为 ， 一 旦 API 的 实现 发 生 了 改 
变 ， 程 序 可 能 就 无 法 正常 工作 。API 的 实现 的 更 迭 可 能 比 你 想象 的 更 频繁 。 例 如 ， 每 个 新 版 
本 的 Java 都 包含 许多 新 的 库 函 数 实 现 。 

通常 情况 下 ， 实 现 是 早 于 API 出 现 的 。 你 可 能 首先 开发 了 一 个 能 用 的 模块 并 完成 了 一 
个 计算 任务 ， 随 后 你 在 新 的 编程 中 又 想 再 次 使 用 它 ， 那 么 你 就 在 新 的 程序 中 直接 使 用 了 这 个 
模块 的 方法 。 在 这 种 情况 下 ， 找 到 一 个 合适 的 时 机 为 程序 仔细 地 设计 并 阅 述 API 是 一 个 明 
智 的 决定 。 因 为 设计 这 些 方法 的 初衷 可 能 没有 考虑 到 会 被 复 用 ， 所 以 这 时 使 用 API 来 完成 
代码 的 可 复 用 设计 是 非常 重要 的 (就 像 我 们 对 Gaussian 程序 做 的 工作 一 样 )。 

本 节 的 其 余部 分 专门 介绍 了 库 和 客户 的 几 个 例子 。 我 们 考虑 这 些 库 的 目的 是 双重 的 。 首 
先 ， 当 你 开发 越 来 越 多 、 越 来 越 复 杂 的 程序 时 ， 这 些 库 将 为 你 提供 更 丰富 的 编程 资源 。 其 
次 ， 当 你 开始 开发 供 自己 使 用 的 库 时 ， 它 们 可 以 成 为 你 学 习 的 例子 。 

随机 数 ” 我 们 已 经 编写 了 几 个 使 用 Math.random() 的 程序 但 是 我 们 的 代码 经 常 需要 
再 做 一 些 额 外 的 工作 ,将 Math.random() 提供 的 0 到 1 之 间 的 随机 双 浮 点 数值 转换 为 我 们 
想 要 使 用 的 随机 数 的 类 型 (比如 随机 布尔 值 或 特定 范围 内 的 随机 整 型 值 )。 为 了 有 效 地 复 用 
我 们 代码 实现 的 这 一 部 分 工作 ,我 们 将 从 现在 开始 使 用 程序 2.2:1 中 实现 的 StdRandom 库 。 
StdRandom 使 用 重 载 机 制 实现 服从 各 种 分 布 的 随机 数 生成 。 你 可 以 按照 使 用 我 们 自 定 义 的 标 
准 IO 库 相 同 的 方式 使 用 它们 中 的 任何 一 个 〈 参 见 2.1 节 “ 问 答 环 节 ” 中 的 第 一 问 )。 像 往常 
一 样 ， 我 们 使 用 API 总 结 了 StdRandom 库 中 的 方法 : 


public class StdRandom 





void setSeed(1ong seed) 设置 种 子 以 获得 可 重 现 的 结果 
int uniform(int n) 0 和 n-1 之 间 的 整数 
double uniform(double 10o, double hi) lo 和 和 hi 之 间 的 浮 点 数 
boolean bernoulli(double p) true 的 概率 为 p，false 的 概率 为 1-p 
double gaussian() 高 斯 分 布 ， 均 值 0， 标 准 差 1 
double gaussian(double mu，double sigma) ”高 斯 分 布 ， 均值 mu， 标 准 差 sigma 
int discrete(double[] p) 以 p 国 的 概率 生成 i 
void shuffle(double[] a) 随机 混 排 数 组 af] 中 的 元 素 
随机 数 的 静态 方法 库 的 API 


这 些 方法 对 我 们 来 说 十 分 熟悉 ， 因 此 API 中 的 简短 描述 足以 说 明 它们 所 做 的 工作 。 我 
们 把 这 些 使 用 Math:random() 来 生成 各 种 类 型 的 随机 数 的 方法 集中 在 一 个 文件 ( StdRandom. 
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java) 中 ， 利 用 这 个 文件 来 完成 所 有 的 随机 数 生成 任务 〈 并 尽 可 能 地 复 用 该 文件 中 的 代码 )， 
而 不 是 把 使 用 这 些 方法 的 代码 散播 到 每 个 程序 中 。 每 个 使 用 这 些 方 法 的 程序 都 比 直接 调用 
Math.random() 的 代码 更 清晰 ， 因 为 StdRandom 中 提供 的 方法 已 经 在 API 中 清楚 地 表达 了 使 
用 Math.random() 实现 的 功能 。 

API 设计 。 我 们 对 传递 给 StdRandom 中 每 个 方法 的 值 做 出 某 些 假设 。 例 如 ， 我 们 假设 
客户 仅 对 正 整数 n 调用 uniform(n)， 对 于 0 和 1 之 间 的 p 调 用 bernoulli(p)， 而 仅 对 于 元 素 在 
0 和 1 之 间 并 且 和 为 1 的 数组 调用 discrete0。 所 有 这 些 假 设 都 是 客户 与 实现 之 间 契 约 的 一 部 
分 。 我 们 设计 库 时 ， 尽 可 能 地 使 契约 清晰 明确 ， 避 免 陷入 实现 细节 的 泥潭 。 与 编程 中 的 许多 
任务 一 样 ， 良好 的 API 设计 通常 是 多 次 尝试 和 和 迭代 后 的 结果 。 我 们 总 是 特别 注意 API 的 设 
计 ， 因 为 当 我 们 更 改 API 时 ， 我 们 可 能 需要 更 改 所 有 客户 代码 和 所 有 实现 。 我 们 的 目标 是 
把 “阐明 客户 如 何 使 用 API” 与 “ API 中 的 实际 代码 ”剥离 开 来 。 这 种 做 法 使 我 们 能 够 更 灵 


活 地 修改 代码 ， 也 可 以 随时 使 用 更 高 效 或 更 准确 的 API 实现 。 






















程序 2.2.1 随机 数 库 


public class StdRandom 
{ 






public static int uniform(Cint n) 
{ return (int) (Math.random() * n); } 


public static double uniform(double lo, double hi) 
{ return lo + Math.random() * (hi - 10); } 


public static boolean bernoulli(double p) 
{ return Math.random() < p; } 
public static double gaussian(Q) 
人 33 见 练 习 2.2:17= */ 
public static double gaussian(double mu, double sigma) 
{ return mu + Sigma * gaussian(); 
public static int discrete(double[] probabilities) 
{ 伙 - 见 程序 1.6.2 .*/ 
public static void shuffle(double[] a) 
六 | 于 邮 此 末 232t4 1 
public static void main(String[] args) 
{ a .2 





这 个 库 中 的 方法 计算 了 多 种 类 型 的 随机 数 : 小 于 给 定 值 的 随机 非 负 整数 、 
在 给 定 范围 内 均匀 分 布 、 随 机 的 二 进 制 位 〈 伯 努 利 分 布 ) 、 标 准 高 斯 分 布 、 可 
以 设 定 均值 和 标准 差 的 高 斯 分 布 ， 以 及 给 定 的 某 个 离散 分 布 。 









% java StdRandom 5 
90 26.36076 false 8.79269 0 
13 18.02210 false 9.03992 1 
58 56.41176 true 8.80501 0 
29 16.68454 false 8.90827 0 
85 86.24712 true 8.95228 0 


单元 测试 。 即 便 我 们 在 实现 StdRandom 时 没有 涉及 任何 特定 的 客户 ， 但 是 包含 一 个 测 
试 客户 test client) main() 的 程序 还 是 很 有 必要 的 ， 尽 管 在 客户 类 使 用 库 时 不 使 用 它 ， 但 是 
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在 调试 和 测试 库 中 的 方法 时 会 用 到 。 无 论 何 时 创建 库 ， 都 应 该 包含 一 个 用 于 单元 测试 和 调试 
的 main() 方法 。 如 果 编 写 一 个 正确 的 单元 测试 本 身 可 能 是 一 个 重大 的 编程 挑战 〈 例 如， 如 何 
测试 StdRandom 中 的 方法 产生 的 数字 与 真正 随机 数 具 有 相同 特征 ， 专 家 们 仍 在 讨论 )。 但 至 
少 应 该 包括 一 个 可 以 实现 如 下 功能 的 main() 方法 : 

。 运行 所 有 代码 。 

。 在 一 定 程度 上 验证 代码 的 工作 是 否 正 确 。 

。 从 命令 行 获取 参数 以 便 进行 更 多 的 测试 。 

然后 ， 当 你 想 更 广泛 地 使 用 库 时 ， 你 应 该 优化 main() 方法 来 进行 更 详尽 的 测试 。 例 如 ， 
我 们 可 以 从 StdRandom 的 以 下 代码 开始 (以 shuffle( 的 测试 作为 练习 ): 

public static void main(String[] args) 

int n = Integer.parseInt(args[0]); 


double[] probabilities = { 0.5, 0.3, 0.1, 0.1 }; 
for Cint'i = 0; 1 < hn’ 14+) 


StdOut.printf(" %2d " , uniform(100)); 
StdOut.printf("%8.5f ", uniform(10.0, 99.0)); 
StdOut.printf("%5b " , bernoull1i(0.5)); 
StdOut.printf("%7.5f ", gaussian(9.0, 0.2)); 
StdOut.printf("%2d " , discrete(probabilities)); 


StdOut .print1nO; 
} 

} 

当 我 们 将 这 个 代码 包含 在 StdRandom.java 中 并 且 在 程序 2.2.1 中 调用 这 个 方法 时 ， 输 
出 必然 如 下 : 第 一 列 中 的 整数 也 可 能 是 从 0 到 99 的 任何 值 ; 第 二 列 中 的 数字 可 能 在 10.0 和 
99.0 之 间 均 匀 分 布 ; 第 三 列 中 约 一 半 的 值 为 真 ; 第 四 列 的 数字 平均 值 约 为 9.0， 且 不 可 能 偏 
离 太 多 ; 最 后 一 列 约 为 50%0s、30%1s、10%2s 和 10%3s。 若 某 列 结果 不 准确 ， 我 们 可 以 键 
入 java StdRandom 10 或 100 来 查看 更 多 结果 。 在 这 个 例子 中 ， 我 们 可 以 〈 并 应 该 ) 在 单独 
的 客户 程序 中 进行 更 广泛 的 测试 ， 以 检查 这 些 数 字 是 否 与 服从 指定 分 布 的 真正 随机 数 具 有 
相同 的 特性 (参见 练习 2.2.3 )。 一 个 有 效 的 方法 是 使 用 StdDraw 来 编写 测试 客户 程序 ， 因 为 
数据 可 视 化 可 以 快速 识别 程序 的 表现 是 否 符合 预期 。 例 如 ， 在 程序 中 生成 大 量 的 点 , 其 x 和 [33] 
?坐标 都 是 从 各 种 分 布 中 随机 抽取 ， 这 些 点 组 成 的 图 像 通常 能 够 给 出 关于 这 个 分 布 的 重要 属 
性 的 直观 感受 。 除 此 之 外 ， 随 机 数 生成 代码 中 任何 的 错误 都 可 很 容易 地 在 这 样 的 图 像 中 显示 
出 来 。 

压力 测试 。 被 广泛 使 用 的 库 ， 如 StdRandom 也 应 该 进行 压力 测试 (stress test)， 通 过 测 
试 我 们 可 以 确保 当 客 户 不 遵守 契约 或 做 出 一 些 未 明确 说 明 的 操作 时 ， 它 们 不 会 盘 溃 。Java 自 
带 的 库 已 经 通过 了 这 样 的 压力 测试 ， 这 需要 仔细 检查 每 一 行 代码 ， 并 观察 某 些 情况 是 否 可 
能 导致 问题 。 如 果 数 组 元 素 的 和 不 等 于 1， 则 discrete() 函数 会 怎么 办 ? 如 果 参 数 是 长 度 为 0 
的 数组 呢 ? 如 果 双 参数 的 uniform() 的 两 个 参数 中 ， 其 中 一 个 或 两 个 均 是 NaN 或 者 无 穷 ， 那 
么 应 该 怎么 做 ? 你 可 以 想到 的 任何 问题 都 是 合理 的 。 这 种 情况 有 时 被 称 为 边界 情况 〈corner 
cases)。 你 肯定 会 遇 到 对 边界 情况 非常 在 意 的 老师 或 主管 。 作 为 经 验 之 谈 ， 大 多 数 程序 员 应 
该 尽早 学 会 找到 边界 情况 并 处 理 好 它们 的 方法 ， 以 避免 在 测试 和 调试 过 程 中 产生 太 多 的 不 愉 
快 。 再 次 强调 ,合理 的 做 法 是 将 压力 测试 作为 一 个 单独 的 客户 实施 。 


public class RandomPoints 
public static void main(String[] args) 


int n = Integer.parseInt(args[0]); 

for (Cint i = 0; i < n; i++ 

{ 
double x = StdRandom.gaussian(.5, .2); 
double y = StdRandom.gaussian(.5, .2); 
StdDraw.point (x, y); 
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数组 的 输入 和 输出 ”我 们 已 经 看 到 并 将 继续 看 到 许多 例子 ， 我 们 希望 将 数据 保存 在 数组 
中 进行 处 理 。 因 此 ， 构 建 一 个 库 来 完善 StdIn 和 StdOut 是 很 实用 的 ， 它 应 该 提供 一 些 静 态 方 
法 ， 用 于 从 标准 输入 读 取 基本 类 型 的 数组 ， 或 者 将 数组 打印 到 标准 输出 。 以 下 API 提供 了 
这 些 方法 : 


public class StdArrayI0 





double[] readDoublelD() 读 取 一 维 浮 点 数 数组 
double[][] readDouble2D() 读 取 二 维 浮 点 数 数组 
void print(double[] a) 输出 一 维 浮 点 数 数组 

void print(double[][] a) 输出 二 维 浮 点 数 数 组 


注 1: 以 1D 结 尾 的 函数 ， 其 格式 是 1 个 整数 mn 后跟 n 个 值 
注 2: 以 2D 结 尾 的 函数 ， 其 格式 是 2 个 整数 m 和 n， 后 面 跟着 mxn 个 值 ， 以 行 排序 
注 3: API 中 还 包括 基于 int 和 boolean 的 相同 方法 


数组 输入 输出 的 静态 方法 库 的 API 


上 述 表格 底部 的 前 两 个 注解 提示 我 们 ， 需 要 确定 一 个 文件 格式 ( file format)。 为 了 简单 
和 协调 ， 我 们 假设 出 现在 标准 输入 中 的 所 有 值 都 会 首先 标明 维度 ， 然 后 按照 上 述说 明 中 期 望 
的 顺序 排列 。read*() 系列 方法 期 望 以 此 格式 作为 输入 ; print( 方法 以 此 格式 生成 输出 。 表 底 
部 的 第 三 个 注解 表明 ，StdArrayIO 实际 上 包含 12 个 方法 ，int 型 、double 型 和 boolean 型 各 
4 个 。print() 方法 是 重 载 的 (它们 都 具有 相同 的 名 称 print()， 但 参数 类 型 不 同 )， 但 是 read*() 
系列 方法 需要 通过 添加 类 型 名 称 (大 写 ， 类 似 于 StdIn 中 的 格式 )， 后 面 跟着 1D 或 2D 的 形 
式 来 生成 不 同 的 名 称 。 

通过 1.4 节 和 2.1 节 中 的 处 理 数组 代码 来 实现 这 些 方法 是 直观 的 ， 如 StdArrayIO (程序 
2.2.2 ) 所 示 。 将 所 有 这 些 静 态 方 法 打包 成 一 个 文件 一 一 StdArrayIO.java， 就 可 以 使 我 们 轻松 

地 复 用 代码 ， 从 而 避免 在 稍 后 编写 客户 程序 时 再 次 编写 读 取 和 输出 数组 的 细节 。 


迭代 函数 系统 ”科学 家 发 现 ， 


胡 玫 和 榜 块 










程序 2.2.2 ”数组 IO 库 
public class StdArrayIO 


public static double[] readDoub1lelDO) 

/#* 见 练习 2.2.11 *#/ } 
public static double[][] readDouble2D() 
{ 















int m = StdIn.readIntO); 
int n = StdIn.readInt(); 
double[][] a = new 人 [n] ; 
for (Cint i = 0; i < m; i++) 
for (int j = 0; j < n; j++) 4 tiny2D.txt 
a[i][j] = StdIn.readDouble(); .000 


.270 .000 

VEN .246 .224 -.036 

} .222 .176 .0893 

public static void print(double[] a) =.032 .739 .270 
{ 7# 见 练习 2.2: 11 */ } 


% StdA I0 < tiny.txt 
public static void print(double[][], a) % java Store < tiny,tx 
{ 


0.00000 0.27000 0.00000 


intmnem arlengthas.. 0:24600 0:22400 -0.03600 
int n = ar0].Tength;  ，， 0.22200 0.17600 0.08930 
System.eut.println(m Es "+. -0.03200 0.73900 ”0:27000 









for Cint 1 =-0; 1 < m; i++) 





for Cint j = 0; j < 'n; j++) 
StdOut .prinf("%9.5f ", a[i][j]); 
StdOut .print1nO; 















Stdout.println0); 
} 

/ 针对 其 他 类 型 的 数据 的 方法 是 类 似 的 (参见 本 书 官网 ) 
public static void main(String[] args) 

{ print(readDouble2D()); } 








这 种 静态 方法 库 有 助 于 从 标准 输入 读 取 一 维和 二 维 数组 ， 并 将 它们 打印 
ae (参见 相应 文本 ) 。 示 例 中 输出 的 数字 是 
的 一 部 分 。 


我 们 可 以 使 用 StdRandom、StdDraw 和 .StdArrayIO 研究 这 样 的 系统 行为 。 


谢 尔 宾 斯 基 三 角形 。 我 们 首先 来 分 析 以 下 简单 过 程 : 一 开始 ， 在 给 定 等 边 三 角形 的 二 个 
顶点 上 绘制 一 个 点 ;然后 在 三 个 顶点 中 随机 选择 一 个 ， 并 在 刚 绘 制 的 点 和 前 一 个 绘制 的 顶点 
的 连 线 中 点 上 绘制 一 个 新 点 。 不 断 重复 这 一 操作 。 每 次 迭代 中 ， 我 们 会 将 上 一 次 迭代 时 绘制 
出 的 线段 中 点 作为 起 点 ， 从 三 角形 中 随机 选取 一 个 顶点 作为 终点 ， 以 这 两 个 点 为 线段 两 端 ， 
我 们 绘制 出 这 条 线段 的 中 点 。 由 于 我 们 进行 随机 选择 ， 所 以 这 些 点 应 该 具有 随机 点 的 一 些 特 


征 ， 在 最 初 的 几 次 迭代 之 后 如 下 : 


(1/2, ,3/2) 入 Ss 


X Wy A A i 





(0, 0) 


RS 
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有 些 复杂 的 视觉 图 像 可 以 通过 多 次 简单 的 计算 过 程 得 到 。 
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为 了 研究 上 述 过 程 大 量 和 迭代 后 的 结果 ,我 们 可 以 按照 规则 编写 程序 ， 并 绘制 出 trails 
个 点 : 


06050500 
0，0.000，0.866 }; 
0.0; 

trials; t++) 


double[] cx = { 
double[] cy = { 
double x = 0.0， 
for Cint t =805 
{ 
int r = StdRandom.uniform(3); 
X= x Sr) / 2:05 
y= (y + cy[r]) / 2.0; 
StdDraw.point(x, y); 
} 


239 我 们 将 三 角形 顶点 的 x 坐标 和 y 坐标 分 别 存 储 在 数组 cx[] 和 cy[] 中 。 我 们 通过 StdRandom. 
uniform() 从 这 些 数 组 中 随机 选择 一 个 下 标 索 引 7 一 一 所 选项 点 的 坐标 即 为 (cx[7], cy[7])。 从 
(xy) 到 该 顶点 的 线段 的 中 点 的 x 坐标 由 表达 式 (x+ex[7])/2.0 给 出 ， 同 理 可 得 y 坐标 。 然 后 
再 通过 对 StdDraw.point() 的 调用 将 这 个 点 绘制 出 来 ， 将 这 些 代 码 放 到 循环 里 ， 即 可 实现 我 
们 想 要 的 功能 。 值 得 注意 的 是 ， 尽 管 有 随机 性 ， 但 是 经 过 大 量 的 迭代 ， 总 是 会 出 现 相同 的 图 
像 。 这 个 图 像 被 称 为 谢 尔 宾 斯 基 三 角形 (Sierpinski triangle)( 见 练习 2.3.27 )。 这 样 一 个 规则 
的 图 像 是 由 这 样 的 随机 过 程 产生 的 ， 如 何 理解 这 个 过 程 是 一 个 非常 有 趣 的 问题 。 


0.00 
0.00 
y 
和 这 








一 个 随机 过 程 ? 


巴 思 斯 利 茧 。 为 了 增加 神秘 性 ， 我 们 可 以 改造 这 个 游戏 的 规则 ， 以 创造 出 更 丰富 的 图 
像 。 而 最 有 意思 的 一 个 例子 就 是 巴 恩 斯 利 蕨 (Barnsley fern)。 想 要 生成 这 个 图 像 ， 我 们 可 以 
利用 与 前 面相 同 的 过 程 ， 但 是 这 次 需要 使 用 下 表 的 公式 来 完成 计算 。 每 一 步 ， 我 们 按照 指 
定 的 概率 来 选择 公式 更 新 x 和 y (使 用 第 一 对 公式 的 概率 是 1%， 使 用 第 二 对 公式 的 概率 是 
85%， 以 此 类 推 )。 


概率 


更 新 x 使 用 的 公式 


更 新 "使 用 的 公式 





1% 

85% 

7% 

240 7% 


关 运 0.500 
XxX= 0.85x 十 0.04y 十 0.075 
X= 0.20x—0.26y—0.400 
X= —0.15x+0.28y+0.575 


y= 0.16y 

y=—-0.04x++0.85y 十 0.180 
y= 0.23x 十 0.227 十 0.045 
y= 0.26x 十 0.247 - 0.086 


我 们 可 以 按照 刚刚 为 谢 尔 宾 斯 基 三 角形 写 的 代码 那样 的 形式 编写 代码 来 迭代 这 些 规则 ， 
但 矩阵 处 理 为 我 们 提供 了 一 种 统一 的 方法 以 生成 代码 来 处 理 任何 规则 集 。 如 果 有 m 种 不 
同 的 转换 ,我们 可 以 用 一 个 m 维 向 量 表 示 每 种 转换 的 使 用 概率 ， 然 后 我 们 用 StdRamdom. 
discrete() 函数 从 中 选择 某 一 种 转换 方式 。 对 于 每 个 变换 中 x 和 y 的 更 新 方法 ,我 们 可 以 分 
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别 为 其 定义 方程 ， 然 后 我 们 就 可 以 使 用 两 个 mX3 矩阵 来 存储 这 些 方程 的 系数 ， 用 于 
区 征用 起 砍 


程序 2.2.3 夺 代 机 数 系统 


public class IFS 
| 


public static void main(String[] args) 


{ WU 进行 trials 遍 绘制 迭代 ， 其 中 trials 由 标准 输入 得 到 


int trials = Integer.parseInt(args[0]); 


trials 
dist[] 


double[] dist 
double[][] cx 
double[][] cy 


= StdArrayI0.readDouble1D(); 
StdArrayI0.readDouble2D(); 
StdArrayI0.readDouble2DO; 


cx[][] 
cy[][] 


double x = 0.0, y = 0.0; 4 
for (int t = 0; t < trials; t++) 
{ /绘制 一 次 迭代 
int r = StdRandom.discrete(dist); 
double x0 = cx[r][0]*x + cx[r][1]*y + cx[r][2]; 
double y0 = cy[r][0]*x + cy[r][1]*y + :cy[r][2]; 
XxX =X0; 
= y0; 
StdDraw.point(x, y); 


这 是 一 段 数据 驱动 的 程序 ， 它 是 StdArrayIO、StdRandom 和 StdDraw 的 客 
户 程序 。 程 序 从 标准 输入 上 迭代 读 取 了 一 个 m 维 向量 ( 概率 值 ) 和 两 个 m x 3 
矩阵 (分别 用 于 表示 x 和 ly 的 系数 ) ,然后 基于 这 些 参数 所 定义 的 函数 系统 进 
行 迭 代 ， 最 后 在 标准 绘图 上 绘制 一 系列 点 。 有 趣 的 是 ,该 代码 不 需要 知道 m 
的 值 ， 因 为 它 使 用 男 外 的 方法 来 创建 和 处 理 矩 阵 。 


~ % more sierpinski.txt ，% java IFS 10000 < sierpinski.txt 
3 


“33 633 “3 






A 


全 信 


% more barnsley.txt % java IFS 20000 < SY txt 
4 sap 


ep 


PR 








“0 1785 207°50F | 


43 
00 .00 .500 
85 .04 .075 
20 -.26 .400 
=315 28 .375 
43 
00 .16 .000 
~ 04. .85 -180 
23 T2049 
.26 .24 -.086 


迁 代 函数 系统 的 一 些 例子 


为 more tree.txt 





6 % java IFS 20000 < tree.txt 
0 
6 
00 .00 .550 
=:05: 00 3525 
46 =:15” 3270 
47 -515 .265 
43 .26 .290 
"A .20 -200 
63 
00 .60 .000 
-.50 .00 .750 
39 7 .387 ,105 
17 .42 .465 
-.2573.45 .625 
-.35[7x31 .525 
% java IFS 20000 < coral.txt 
% more coral.txt : : 人 
3 EF 
.40 .15 .45 | 
: ni 
.3077 -:5315 .8863 | “ , 2 
.3077 -.0769 .2166 ea Ke neta0 
.0000 .5455 .0106 Eo “i 
.3 > 此 
-.4615 -.2937 1.0962 多 
.1538 -.4476 .3384 
.6923 -.1958 .3808 ph 
241 . 
\ 
242 迭代 函数 系统 的 一 些 例子 ( 续 ) 


IFS (程序 2.2.3 ) 实现 了 该 计算 的 数据 驱动 版 本 。 这 个 程序 实现 了 无 限 的 探索 可 能 性 : 
它 能 够 根据 任何 有 效 输入 数据 进行 迭代 ， 输 入 数据 包含 一 个 定义 概率 分 布 的 向 量 和 两 个 定义 
系数 的 矩阵 ， 分 别 用 于 描述 x 和 yy 的 更 新 方法 。 对 于 刚刚 给 出 的 方程 系数 ， 即 使 我 们 在 每 个 
步 又 中 选择 随机 方程 ,经 过 多 次 计算 后 都 会 出 现 相同 的 图 像 : 这 是 一 个 看 起 来 非常 类 似 于 你 
在 树林 里 看 到 的 茧 类 植物 ， 而 不 像 是 计算 机 上 随机 产生 的 事物 。 





生成 一 个 巴 恩 斯 利 蕨 


上 述 这 样 一 个 简短 的 程序 IFS， 它 从 标准 输入 读 取 一 些 数字 ， 然 后 根据 不 同 的 数据 就 可 
以 在 标准 图 像 上 绘制 ， 不 必修 改 任何 代码 就 可 以 生成 谢 尔 宾 斯 基 三 角形 和 巴 恩 斯 利 藤 (以 及 
许多 其 他 图 像 )， 这 是 非常 引 人 注 目的 。 因 为 代码 简单 而 且 结果 神奇 ， 这 种 计算 对 于 图 像 合 
成 等 任务 非常 有 用 ， 常 用 于 生成 电影 和 游戏 中 的 模拟 现实 图 像 。 
也 许 更 重要 的 是 ， 通 过 如 此 简单 的 计算 就 能 产生 如 此 逼真 的 图 像 ， 为 我 们 提出 了 一 个 有 趣 
243] ”的 科学 问题 : 这 个 计算 的 过 程 是 不 是 贴 合 某 个 自然 规律 ?自然 规律 是 不 是 遵从 某 个 计算 原理 ? 
统计 接 下 来 ,我 们 讨论 一 个 应 用 于 科学 与 工程 领域 的 库 ， 它 由 一 组 并 非 全 都 可 以 在 
Java 标准 库 里 实现 的 数学 计算 和 基本 可 视 化 工具 组 成 。 这 些 计算 涉及 理解 一 组 数字 的 统计 特 
性 。 这 些 库 非常 实用 ， 例 如 ， 在 我 们 执行 一 系列 数据 测量 的 科学 实验 时 ， 就 需要 使 用 这 些 库 
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来 处 理 数据 。 现 代 科学 家 面临 的 最 重要 的 挑战 之 一 就 是 对 这 些 数 据 进行 适当 分 析 ， 而 计算 在 
这 种 分 析 中 发 挥 着 越 来 越 重要 的 作用 。 下 面 的 表格 列 出 了 这 些 基本 数据 分 析 方 法 的 API: 


public class StdStats 


double max(double[] a) 最 大 值 
double min(double[] a) 最 小 值 
double mean(double[] a) 平均 值 
double var(double[] a) 样本 方差 
double stddev(double[] a) 样本 标准 差 
double median(double[] a) 中 位 数 


void plotPoints(double[] a) 在 (i,alij) 处 绘制 点 

void plotLines(double[] a) ”绘制 过 接点 (i.a[ 让 的 线段 

void plotBars(double[] a) 绘制 G.a[ 让 处 的 条 形 图 
注 : 也 包含 其 他 数值 类 型 的 重 载 实现 


数据 分 析 的 静态 方法 库 的 API 






















程序 2.2.4 数据 分 析 座 
public class StdStats 


public static double max(double[] a) 
{ 7 计算 a[] 的 最 大 值 
double max = Double.NEGATIVE_INFINITY; 
for (int i = 0; i < a.length; i++) 
if (a[i] > max) max = a[i]; 
return max; 


} 


public static double mean(double[] a) 
{ 1 计算 a[] 的 平均 和 值 
double sum = 0.0; 
for (int i = 0; i < a.length; i++) 
sum = sum + a[i]; 
return sum / a.length; 
} 


public static double var(double[] a) 
{ /计算 a[] 值 的 样本 方差 
double avg = mean(a); 
double sum = 0.0; 
for (int i = 0; i < a.length; i++) 
sum += (a[i] - avg) * (a[i] - avg); 
™ return sum / (a.length - 1); 
} 
public static double stddev(double[] a) 
{ return Math.sqrt(var(a)); 


人 参见 程序 2.2.5 的 绘制 方法 
public static void main(String[] args) 
{x 参见 正文 */ 








该 代码 实现 了 计算 客户 端 数组 中 数字 的 最 大 值 、 均 值 、 方 差 和 标准 差 的 方 
本 而 省 略 了 计算 最 小 值 的 方法 。 绘 图 方法 在 程序 2.2.5 中 ; median0 的 实现 参 
见 练习 4.2.20。 













% more tinyl1D. txt 
5 
3.0 1.0 2.0 5.0 4.0 


% java StdStats < tinylD.txt 
min 
mean 3.000 
max 5.000 
std dev 1.581 
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Co+XI 二 十 -1) 


基本 统计 。 假设 我 们 有 n 个 测量 值 xx zis 这 些 测量 的 平均 值 由 公式 /= 
给 出 ， 通 常用 来 做 这 些 数值 的 估计 值 。 最 小 值 和 最 大 值 也 是 有 意义 的 ， 中 位 数 (小 于 一 半 的 数 并 且 
大 于 一 半 的 数 ) 的 信也 是 如 此 。 样 本 方差 也 是 有 用 的 ， 它 册 公 式 = 全 的 
计算 ; 样本 标准 差 是 样本 方差 的 平方 根 。StdStats (程序 2.2.4 ) 显示 了 计算 这 些 基 本 统计 
信息 的 静态 方法 (中 位 数 比 其 他 数据 更 难 计算 ,我 们 将 在 4.2 节 中 考虑 median() 的 实现 )。 
StdStats 的 main() 测试 客户 程序 从 标准 输入 读 取 数字 到 数组 中 ， 并 调用 打印 最 小 值 、 平 均 
值 、 最 大 值 和 标准 偏差 的 方法 ， 如 下 所 示 : 
public static void main(String[] args) 
double[] a = StdArrayI0.readDoub1lelD() ; 
StdOut.printf(" min %7.3f\n", min(a)); 
Stdout.printf(” mean %7.3f\n", mean(a)); 
StdOut.printf(" max %7.3f\n", max(a)); 


StdOut.printf(" std dev %7.3f\n", stddev(a)); 
3 


与 StdRandom 一 样 ， 需 要 进行 更 广泛 的 计算 测试 才能 证 明 程序 的 正确 性 (参见 练习 
2.2.3 )。 通 常 ， 当 我 们 调试 或 测试 库 中 的 新 方法 时 ， 我 们 相应 地 调整 单元 测试 部 分 的 代码 ， 
单元 测试 是 指 一 次 测试 一 种 方法 。 一 个 像 StdStats 这 样 成 熟 和 广泛 使 用 的 库 也 需要 一 个 压力 
测试 的 客户 程序 ， 在 每 次 代码 发 生 修 改 后 都 需要 对 所 有 内 容 进 行 详 细 的 测试 。 如 果 你 有 兴趣 
看 看 这 样 的 客户 程序 是 什么 样 的 ， 你 可 以 在 本 书 官 网 上 找到 StdStats 程序 。 大 多 数 经 验 丰富 
的 程序 员 认 为 花 在 单元 测试 和 压力 测试 上 的 时 间 都 是 很 值得 的 。 

绘图 。StdDraw 的 一 个 重要 用 途 是 帮助 我 们 实现 数据 的 可 视 化 ， 而 不 用 依赖 数据 表格 获 
取信 息 。 在 大 多 数 情况 下 ， 我 们 执行 实验 ， 将 实验 数据 保存 在 数组 中 ， 然 后 将 结果 与 模型 
进行 比较 ， 或 者 与 一 个 描述 数据 的 数学 函数 进行 比较 。 对 于 自 变量 的 值 是 按照 等 差 数列 排 
列 的 情况 ， 我 们 的 StdStats 库 包含 绘制 数组 中 的 数据 的 静态 方法 。 程 序 2.2.5 是 StdStats 的 
plotPoints()、plotLines() 和 plotBars() 方法 的 实现 。 这 些 方法 在 绘图 窗口 中 以 均匀 的 间隔 显 
示 参 数 数组 中 的 值 ， 或 者 使 用 线段 (line) 连接 在 一 起 ,或 者 使 用 每 个 值 对 应 的 圆 点 (point) 
填充 ,或 者 使 用 从 x 轴 到 该 值 的 条 柱 (bar)。 然后 通过 以 上 这 些 图 形 ， 使 用 x 坐标 i 和 yy 坐 
标 a[] 绘制 这 些 点 。 此 外 ， 它 们 都 重新 缩放 x 以 填充 绘图 窗口 (使 得 点 沿 x 坐标 均匀 间隔 )， 
然后 把 y 坐标 的 缩放 留 给 客户 程序 自己 来 随意 控制 。 

这 些 方法 的 目标 并 不 是 提供 一 个 通用 的 绘图 软件 包 ， 但 你 可 以 很 自然 地 找到 可 能 需要 添 
加 的 各 种 各 样 的 工具 : 不 同类 型 的 点 、 坐 标 轴 上 的 标签 、 颜 色 以 及 现代 数据 绘制 系统 的 其 他 
工具 。 在 有 些 情况 下 甚至 可 能 需要 比 这 些 更 复杂 的 方法 。 

我 们 使 用 StdStats 的 意图 是 向 你 介绍 数据 分 析 的 相关 知识 ， 同 时 向 你 介绍 如 何 轻 松 地 定 
义 库 来 完成 数据 分 析 任务 。 实 际 上 ， 这 个 库 已 经 证 明 是 有 用 的 我 们 就 是 使 用 这 些 绘 图 
方法 生成 了 本 书后 面 几 节 的 插图 ， 分 别 是 : 绘制 函数 图 像 、 绘 制 声波 和 绘制 实验 结果 。 接 下 
来 ， 我 们 来 讨论 这 几 个 使 用 示例 。 

绘制 函数 图 。 你 可 以 使 用 StdStats.plot*() 方法 来 绘制 任何 函数 的 图 像 : 选择 要 在 其 中 
绘制 函数 的 x 区间， 在 该 区 间 内 ， 按 照 均匀 的 间隔 计算 对 应 的 函数 值 ， 并 把 它们 存储 在 数组 
中 ,确定 并 设置 y 轴 的 缩放 系数 ， 然 后 调用 StdStats.plotLines( 或 者 其 他 plot*( 方法 。 例 
如 ， 要 绘制 正弦 函数 ,需要 设置 y 轴 的 范围 为 -1 到 +1 之 间 。x 轴 的 范围 由 StdStats 方法 自 
动 设 定 。 如 果 你 不 了 解 该 范围 ， 可 以 调用 以 下 方法 : 


StdDraw. setXscaleO(StdStats.min(a), StdSstats.max(a)) ; 





日 注意 , 这 里 Y 应 该 是 X， 原 书 有 错误 。 一 一 译 者 注 


程序 2.2.5 ”绘制 数组 中 的 数据 值 





public static void plotPoints(double[] a) 


{ /在 (ia[ 训 处 绘制 点 
int n = a.length; 
StdDraw. setXscale(-1, n); 
StdDraw.setPenRadius (1/(3.0*n)); 
for (int i = 0; 1 < n; i++) 
StdDraw.point(i, a[i]); 
} 


public static void plotLines(double[] a) 
{ W 绘制 通过 点 (i,af 让 ) 的 线 
int n = a,length; 
StdDraw.setXscale(-1, n); 
StdDraw.setPenRadius(); 
for (int i = 1; i < Nn; i++) 


StdDraw.1line(i-1, a[i-1], i, a[i]); 


} 


public static void plotBars(double[] a) 
{ // 绘制 二 个 连接 (0,a[ 订 和 (ia[ 认 的 条 柱 
int n = a.length; 
StdDraw.setXscale(-1, n); 
for (Cint i = 0; i < ni i++) 


亏 数 和 楷 如 747 


StdDraw.filledRectangle(i, a[i]/2, 0.25, a[i]/2); 





此 代码 在 StdStats ( 程序 2.2.4 ) 中 实现 了 绘制 数据 的 三 种 方法 它们 分 别 用 
实心 圆 、 线 段 和 条 柱 来 表示 点 Ga [i])。 


plotPoints(a); 
int n = 20; on,10) 
double[] a = new double[n]; 
for (Cint 1 = 0; i < n; i++) 
a[i] = 1.0/(i+1); 


plotLines(a); 





plotBars(a); 


曲线 的 平滑 度 由 函数 的 性 质 和 绘制 的 点 数 确 定 。 正 如 我 们 在 首次 讲 到 StdDraw 时 所 讨论 


的 ， 你 必须 小 心地 抽取 足够 的 点 以 体现 函数 的 波动 。 稍 
后 在 2.4 节 中 ， 我们 还 将 用 另 一 种 方法 来 绘制 不 等 间 
距 采 样 值 的 函数 。 

绘制 声波 。StdAudio 库 和 StdStats 绘图 方法 处 理 
包含 规律 间隔 的 采样 值 的 数组 。1.5 节 和 本 节 开 始 时 的 
声波 图 形 都 是 首先 用 StdDraw.setYscale(-1,1) 缩放 7 轴 ， 
然后 用 StdStats.plotPoints() 绘制 点 。 正 如 你 所 看 到 的 ， 
这 样 的 图 像 可 以 直观 显示 音频 处 理 的 效果 。 你 也 可 以 在 
使 用 StdAudio 播放 声波 的 同时 把 声波 绘制 出 来 。 这 样 
能 够 产生 有 趣 的 效果 ， 不 过 由 于 涉及 的 数据 量 很 大 ， 这 
项 任务 有 一 点 挑战 性 (参见 练习 1.5.23 )。 

绘制 实验 结果 。 你 可 以 在 同一 图 纸 上 放置 多 个 绘图 ， 
一 般 这 样 做 的 目的 是 为 了 将 实验 结果 与 理论 模型 进行 比 
较 。 例 如 ，Bernoulli (程序 2.2.6) 计算 一 枚 普通 硬币 翻 


int n = 50; 
double[] a = new double[n+1]; 
for Cint i = 0; i <= n; i++) 

a[i] = Gaussian.pdf(-4.0 + 8.0*i/n); 
StdStats.plotPoints(a); 
StdStats.plotLines(a); 


绘制 函数 图 


StdDraw.setYscale(-1.0, 1.0); 
double[] hi; 

hi = PlayThatTune.tone(880, 0.01); 
StdStats.plotPoints (hi); 


247 
‘ 
248 
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转 n 次 正面 朝 上 的 次 数 ， 并 将 结果 与 预测 的 高 斯 概率 密度 函数 进行 比较 。 概 率 论 的 一 个 著名 结 
论 是 : 虽然 这 个 实验 结果 是 二 项 分 布 (binomial distribution)， 但 它 非常 近似 于 均值 为 n/2、 标 
准 偏差 为 罕 的 高 斯 分 布 。 我 们 执行 的 试验 次 数 越 多 ， 两 个 分 布 的 偏差 越 小 。Bernoulli 生成 
的 图 像 是 对 实验 结果 的 简单 总 结 ， 并 对 理论 进行 了 令 人 信服 的 验证 。 这 个 例子 是 科学 方法 转 
化 成 为 应 用 程序 编程 的 原型 ， 我 们 在 本 书 中 经 常 使 用 。 建 议 你 每 次 运行 实验 时 也 应 该 使 用 
它 。 如 果 一 个 理论 模型 可 以 用 来 解释 实验 结果 ， 则 可 以 通过 数据 的 可 视 化 将 实验 结果 与 理论 
模型 进行 比较 ， 以 实现 二 者 的 相互 验证 。 

这 几 个 例子 旨 在 说 明 ， 借 助 精心 设计 的 静态 方法 库 可 以 对 数据 分 析 产 生 怎 样 的 帮助 ， 练 
习 中 还 展示 了 其 他 几 个 扩展 和 想法 。 你 将 发 现 ，StdStats 对 于 基本 图 形 的 绘制 非常 有 用 ,我 
们 鼓励 你 尝试 实验 它们 ， 然 后 修改 或 者 添加 一 些 方法 ， 以 创建 自己 的 库 来 绘制 设计 图 。 当 你 


C249| 继续 解决 越 来 越 广泛 的 编程 任务 时 ， 你 将 自然 而 然 地 开始 开发 满足 自己 需求 的 编程 工具 库 。 


程序 2.2.6” 伯 努 利 试验 





public class Bernoul11i 


public static int binomial(int n) 
{ /1 模拟 少 转 硬币 n 次 ; 返回 正面 次 数 
int heads = 0; 
for (int 1 = 0; 1 < n; i++) 
if (StdRandom.bernoull1i(0.5)) heads++; 
return heads; 
3 
public static void main(String[] args) 
1 WU/ 执 行 伯 努 利 斌 验 ， 绘 制 结果 和 模型 
int n = Integer.parseInt(args[0]); 
int trials = Integer.parseInt(args[1]); 


n | 每 次 试验 的 翻转 次 数 | 


int[] freq = new int[n+1]; 


for Cint t-= 0 t < trials; t++) trials | 试验 次 数 
freq[binomial (n)]++; freq[] | 实验 结果 
double[] norm = new double[n+1]; norm[] | 标准 化 结果 


for (int 1 = 0; 1 <= ni i++) phi[] | 高 斯 模型 
norm[i] = (double) freq[i] / trials; rr 
StdStats.plotBars (norm); 


double mean =n/ 2.0; 
double stddev = Math.sqrt(n) / 2.0; 
double[] phi = new double[n+1]; 
for (int i = 0; i <= n; i++) 

phi[i] = Gaussian.pdf(i, mean, stddev); 
StdStats.plotLines (phi); 





StdStats，StdRandom 和 和 Gaussian 客 户 端 可 视 化 说 明了 : 翻转 硬币 n 次 ， 
其 正面 朝 上 的 次 数 符合 高 斯 分 布 。 


% java Bernoulli 20 100000 


模块 化 编程 ”我 们 开发 的 库 展现 了 一 种 称 为 模块 化 编程 (modular programming) 的 编程 
风格 。 相 比 于 在 一 个 单独 的 程序 文件 中 编写 一 个 包含 所 有 功能 细节 的 新 程序 来 解决 新 问题 ， 
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我 们 更 加 倾向 于 将 每 个 任务 分 解 成 更 小 、 更 易于 管理 的 子 任务 ， 然 后 实现 和 独立 调试 解决 每 
个 子 任务 的 代码 。 好 的 库 允 许 我 们 为 未 来 的 客户 定义 和 提供 重要 子 任务 的 解决 方案 ， 以 促进 
模块 化 编程 。 在 编程 时 ， 要 尽 可 能 地 将 程序 明确 地 分 割 成 相互 独立 的 子 任 务 ， 然 后 分 别 实 
现 。Java 支持 这 种 分 离 的 开发 模式 ， 具 体 表现 为 Java 允许 一 个 文件 中 一 个 类 进行 独立 开发 和 
调试 ， 稍 后 可 以 将 多 个 类 对 应 的 文件 集中 在 一 起 使 用 。 通 常 ， 程 序 员 使 用 术语 模块 (module) 
来 指 代 那些 可 以 独立 编译 和 运行 的 代码 ; 在 Java 中 ,每 个 类 (class) 都 是 一 个 模块 。 

IFS (程序 2.2.3 ) 就 是 一 个 模块 化 编程 的 例子 。 这 种 相对 复杂 的 计算 是 通过 独立 开发 
的 几 个 相对 较 小 的 模块 实现 的 。 它 使 用 StdRandom 和 StdArrayIO， 以 及 我 们 习惯 使 用 的 
Integer 和 StdDraw 中 的 方法 。 如 果 我 们 将 IFS 所 需 的 所 有 代码 放 在 一 个 文件 中 ,我 们 将 有 
大 量 的 代码 要 维护 和 调试 ; 通过 模块 化 编程 ， 我 们 就 可 以 更 有 信心 研究 迭代 函数 系统 ， 因 为 
我 们 已 经 在 单独 的 模块 中 实现 并 测试 了 这 些 任 务 的 代码 ， 因 此 可 以 确信 这 些 代码 可 以 正确 读 
取 数 组 ， 并 且 随 机 数 生 成 器 也 能 产生 正确 分 布 的 值 。 


API 描述 
Gaussian 高 斯 分 布 函 数 
StdRandom 随机 数 
StdArrayIO 数组 的 输入 输出 
IFS 迭代 函数 系统 的 客户 程序 
StdStats 数据 分 析 函 数 
Bernoulli 伯 努 利 试验 的 客户 程序 
本 节 中 类 的 汇总 


类 似 地 ，Bernoulli (程序 2.2.6 ) 也 是 一 个 模块 化 编程 的 例子 。 它 是 Gaussian、Integer、 
Math、StdRandom 和 StdStats 的 客户 程序 。 我 们 可 以 再 次 对 这 些 模块 中 的 方法 产生 的 预期 结 
果 有 一 些 信心 ， 因 为 它们 是 系统 库 或 我 们 以 前 测试 、 调 试 和 使 用 过 的 库 。 

为 了 描述 模块 化 程序 中 模块 之 间 的 关系 ,我们 通常 会 绘制 一 个 依赖 关系 图 (dependency 
graph)， 如 果 第 一 个 类 包含 一 个 方法 的 调用 ， 而 第 二 个 类 包含 该 方法 的 定义 ， 那么 我 们 用 以 
这 个 方法 命名 的 箭头 连接 这 两 个 类 名 。 这 样 的 图 表 对 于 代码 的 开发 和 维护 起 着 重要 的 作用 ， 
因为 理解 模块 之 间 的 关系 是 十 分 必要 的 。 















Bernoulli 
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150 惫 2 茧 


我 们 在 本 书 中 强调 模块 化 编程 ， 因 为 它 具 有 许多 被 认为 是 现代 编程 必 不 可 少 的 重要 优 
点 ， 包 括 : 

。 即使 在 大 型 系统 中 ， 我 们 也 应 该 合理 地 控制 程序 的 大 小 。 

。 调试 小 块 代码 更 加 容易 。 

。 我们 可 以 复 用 代码 ， 而 无 须 重 新 实现 。 

。 维护 (和 改进 ) 代码 要 简单 得 多 。 

我 们 将 展开 来 讨论 。 

合理 控制 程序 的 大 小 。 没 有 任何 大 的 任务 是 复杂 到 不 能 被 分 割 成 更 小 的 子 任务 的 。 如 果 
你 发 现 自己 的 程序 已 经 大 到 需要 多 页 代码 才能 完成 ， 你 必须 问 自己 如 下 问题 : 这 些 子 任务 是 
否 可 以 单独 实现 ? 这 些 子 任务 中 的 某 部 分 是 否 可 以 逻辑 分 组 到 一 个 单独 的 库 中 ? 其 他 客户 程 
序 将 来 是 否 可 以 使 用 此 代码 ? 反 过 来 说 ， 如 果 你 发 现 自己 的 模块 太 多 * 太 小 ， 你 也 必须 问 自 
已 如 下 问题 : 是否 有 一 些 逻 辑 上 属于 同一 个 模块 的 子 任务 ? 每 个 模块 是 否 可 能 被 多 个 客户 程 
序 使 用 ? 对 于 模块 大 小 来 说 ， 没 有 必须 遵守 的 规则 : 一 个 重要 的 抽象 概念 的 实现 可 能 恰恰 是 
几 行 代码 ， 而 另 一 个 具有 大 量 重 载 方法 的 库 可 能 会 适当 地 扩展 到 数 百 行 代码 。 

调试 。 随 着 语句 和 交互 变量 的 增多 ,追踪 程序 变 得 更 加 困难 。 追 踪 具 有 数 百 个 变量 的 程 
序 需 要 追踪 数 百 个 值 ， 因 为 任何 语句 都 可 能 会 影响 其 中 一 个 变量 的 值 ， 或 受到 某 个 变量 的 影 
响 。 追 踪 成 百 上 千 甚 至 更 多 的 语句 是 无 法 实施 的 。 模 块 化 编程 和 将 变量 控制 在 可 控 范围 内 的 
指导 原则 ， 促 使 我 们 在 必须 调试 时 可 以 严格 限制 出 错 的 范围 。 客 户 程 序 和 实现 之 间 的 契约 同 
样 重要 。 一 旦 我们 确信 一 段 代码 实现 了 所 有 任务 ， 那 么 我 们 就 可 以 把 这 个 条 件 推广 到 任何 客 
户 程序 的 调试 中 〈( 即 在 调试 客户 程序 时 确信 库 程 序 没有 错误 一 一 译 者 注 )。 

代码 复 用 。 一 旦 我 们 实现 了 StdStats 和 StdRandom 这 样 的 库 ， 我 们 就 不 必 编 写 代 码 来 
计算 平均 值 或 标准 差 ， 或 者 生成 随机 数 ， 而 可 以 只 是 简单 地 复 用 这 些 代 码 。 此 外 ， 我 们 也 不 
需要 复制 代码 : 所 有 模块 都 可 以 引用 其 他 任 一 模块 中 的 所 有 公共 方法 。 

维护 。 如 同 写作 一 样 ， 好 的 程序 总 是 可 以 被 不 断 修改 ， 而 模块 化 编程 便于 不 断 改进 
Java 程序 ， 因 为 改进 一 个 模块 就 可 以 改进 所 有 的 客户 程序 。 例 如 ， 在 通常 情况 下 ， 解决 特定 
的 问题 有 几 种 不 同 的 方法 。 使 用 模块 化 编程 ， 你 可 以 实现 多 个 独立 实现 。 更 重要 的 是 ， 在 开 
发 新 客户 程序 的 同时 ， 你 可 能 会 发 现 某 些 模块 中 的 错误 。 因 为 模块 化 编程 ， 修 复 该 模块 中 的 
错误 基本 上 修复 了 所 有 客户 程序 中 的 同类 错误 。 

如 果 你 遇 到 一 个 旧 程 序 (或 者 一 个 老 套 的 程序 员 编写 的 新 程序 )， 你 可 能 会 发 现 一 个 巨 
大 的 模块 一 一 长 串 的 语句 ， 扩 展 到 几 页 或 更 多 页 ， 其 中 任何 语句 可 以 引用 该 程序 的 任何 变 
量 。 这 些 老式 程序 甚至 会 出 现在 我 们 的 基础 设施 的 计算 程序 的 关键 部 分 (如 某 些 核电 厂 和 部 
分 银行 )， 这 时 因为 负责 维护 的 程序 员 无 法 理解 这 种 写法 ， 导 致 了 他 们 无 法 用 现代 语言 对 其 
进行 重 写 。 通 过 支持 模块 化 编程 ，Java 这 样 的 现代 语言 可 通过 将 功能 划分 成 类 ， 然 后 单独 开 
发 方法 库 来 帮助 我 们 避免 这 种 情况 。 

在 不 同文 件 之 间 共 享 静态 方法 ， 从 根本 上 扩展 了 我 们 的 编程 模型 。 第 一 ， 它 允许 我 们 复 
用 代码 ， 而 不 必 维 护 它 的 多 个 副本 ; 第 二 ， 它 允许 我 们 将 程序 组 织 成 可 以 独立 编程 、 易 于 调 
试 、 大 小 合理 的 文件 。 这 两 点 都 强烈 地 支持 了 我 们 的 基本 理念 : 在 编程 时 ， 要 尽 可 能 地 将 程 
序 明确 地 分 割 成 相互 独立 的 子 任务 ， 然 后 分 别 实现 。 

在 本 节 中 ， 我 们 在 1.5 节 的 几 个 库 的 基础 上 又 增加 了 Gaussian 、StdArrayIO 、StdRandom 
和 StdStats 等 一 些 可 供 使 用 的 库 。 同 时 ， 我 们 用 几 个 客户 程序 说 明了 它们 的 用 法 。 这 些 工具 
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主要 是 在 科学 项 目 或 工程 任务 中 出 现 的 基本 数学 概念 。 本 书 的 目的 不 仅仅 是 提供 工具 ， 还 要 
说 明 创建 自己 的 工具 也 是 很 容易 的 。 大 多 数 现代 程序 员 在 处 理 复杂 任务 时 提出 的 第 一 个 问题 
是 “我 需要 哪些 工具 ?”。 当 需要 的 工具 不 方便 得 到 时 ， 第 二 个 问题 是 “实现 它们 有 多 难 ?”。 
要 成 为 一 个 好 的 程序 员 ， 你 应 该 有 信心 构建 自己 的 软件 工具 ， 并且 也 应 该 足够 聪明 地 知道 何 
时 该 去 库 中 寻求 更 好 的 解决 方案 。 

在 学 习 了 库 和 模块 化 编程 后 ， 学 习 现代 编程 模型 还 有 一 个 步骤 : 面向 对 象 的 编程 (object- 
oriented programming)， 也 就 是 第 3 章 的 主题 。 通 过 面向 对 象 编程 ， 你 可 以 构建 充分 发 挥 函 
数 的 副作用 的 库 (当然 ， 是 以 一 种 受 控 的 方式 来 使 用 的 )， 以 极 大 扩展 Java 编程 模型 。 在 转 
向 面向 对 象 编程 之 前 ， 在 本 章 中 我 们 还 将 涉及 以 下 两 方面 的 内 容 ; 任何 方法 都 可 以 调用 自身 
的 编程 理念 (2.3 节 )， 以 及 在 较 大 规模 的 客户 程序 中 关于 模块 化 编程 的 案例 研究 (2.4 节 )。 
问答 环节 , 

问 : 我 试图 使 用 StdRandom ， 但 是 收 到 了 错误 消息 “Exception in thread”main “ java. 
lang.NoClassDefFoundError: StdRandom”， 错 在 哪里 了 呢 ? 

答 : 你 需要 使 Java 可 以 访问 StdRandom。 请 看 1.5 节 末 尾 问答 环节 的 第 一 问 。 

问 : 是 否 有 一 个 关键 字 能 够 将 class 标识 为 库 ? 

答 : 没有 ， 因 为 类 中 的 任何 一 个 public 类 型 的 方法 都 可 以 被 定义 为 库 中 的 函数 。 从 这 个 
角度 来 说 ， 有 一 点 概念 上 的 脱节 。 确 实 , 创建 一 个 你 自己 编译 和 运行 的 .java 文件 是 一 回 事 ， 
创建 一 个 自己 很 久 以 后 才 会 使 用 的 :java 文件 是 另 一 回 事 ， 而 创建 二 个 .java 文件 供 别 人 在 将 
来 使 用 又 是 完全 不 同 的 一 回 事 了 。 你 需要 多 写 一 些 库 来 供 自己 使 用 ， 然 后 才能 成 长 为 有 经 验 
的 系统 程序 员 。 

问 : 如 何 开发 一 个 我 已 经 使 用 了 一 段 时 间 的 库 的 新 版 本 ? 

答 : 着 慎 。 我 们 最 好 在 单独 的 目录 中 工作 ， 因 为 对 API 的 任何 更 改 都 可 能 会 破坏 原来 
的 客户 程序 。 所 以 当 你 修改 你 的 库 时 ， 确 保 你 正在 处 理 的 是 代码 的 副本 。 当 你 改变 一 个 有 许 
多 客户 的 库 时 ， 你 就 能 明白 许多 公司 在 推出 新 版 本 的 软件 时 面临 的 问题 了 。 如 果 你 只 是 想 给 
库 添加 一 些 方法 ， 那 就 直接 做 吧 : 这 样 做 不 太 危险 ， 但 你 经 过 几 次 修改 后 就 会 意识 到 ， 你 可 
能 还 需要 支持 这 个 库 很 多 年 ! 

问 : 我 要 怎么 知道 一 个 实现 是 否 正确 地 运行 了 ?为 什么 不 自动 检查 它 是 否 满足 API? 

答 : 我 们 使 用 非 正式 的 说 明 ， 因 为 要 编写 详细 的 说 明和 直接 编写 程序 没什么 区 别 。 此 
外 ， 理 论 计算 机 科学 的 基本 原理 表明 ， 这 样 做 甚至 无 法 解决 基本 问题 ， 因 为 通常 没有 办 法 检 
查 两 个 不 同 的 程序 是 否 执行 了 相同 的 计算 。 


练习 


2.2.1 在 Gaussian (程序 2.1.2 ) 中 增加 一 个 三 参数 静态 方法 pdf(x,mu,sigma) 的 实现 ， 使 其 根据 给 定 的 
平均 值 y 和 标准 差 vc， 根据 公式 $ (x,y,0)=$((x-10)/0)/o， 计 算 高 斯 概率 密度 函数 。 再 基于 公式 
$B (zy4,0)=B((z-1)/0)， 增 加 一 个 相关 的 累积 分 布 函 数 cdf(z,mu,sigma) 的 实现 。 

2.2.2 编写 一 个 静态 方法 库 以 实现 双 曲 线 函 数 ， 其 中 : 定义 sinh(x)=(e*-e*)/2，cosh(x)=(e*te /2 的 ， 
其 中 tanh(x)、coth(x)、sech(x) 和 csch(x) 以 类 似 于 标准 三 角 函 数 的 方式 定义 。 

2.2.3 “为 StdStats 和 StdRandom 编写 一 个 测试 用 客户 程序 ， 以 检查 两 个 库 中 的 方法 是 否 按 预期 运行 。 
该 程序 需要 输入 命令 行 参数 n， 使 用 StdRandom 中 的 每 种 方法 生成 n 个 随机 数 ， 并 打印 其 统计 


152 


2.2.4 


py 


2.2.6 


2 


2.2.8 


2: 和 0 


2.2.11 
2:242 


22.13 


第 2 昔 


信息 。 提 示 : 将 计算 得 到 的 结果 与 预期 的 结果 进行 比较 以 得 出 结论 。 
为 StdRandom 添加 一 个 方法 shuffle()， 它 将 一 个 double 型 数组 作为 参数 ， 并 以 随机 顺序 不 断 重 
新 排列 。 设 计 一 个 测试 用 客户 程序 ， 检 查 数组 的 每 个 排列 出 现 的 次 数 是 否 大 致 相同 。 将 参数 蔡 
换 为 Int 型 数组 和 Strings 型 数组 并 给 出 重 载 后 的 设计 。 
开发 一 个 对 StdRandom 进行 压力 测试 的 客户 程序 。 要 特别 注意 discrete()。 例 如 ， 概 率 总 和 是 否 
为 1? 
写 一 个 静态 方法 ， 参 数 是 double 型 的 ymin 和 ymax (ymin 严格 小 于 ymax) 和 一 个 double 数组 
a[]， 并 使 用 StdStats 库 线 性 缩放 a[] 中 的 值 ， 使 a[] 中 每 个 元 素 都 在 ymin 和 ymax 之 间 。 
编写 Gaussian 和 StdStats 的 客户 程序 ， 探 讨 改变 高 斯 概率 密度 函数 的 均值 和 标准 差 的 影响 。 在 
均值 固定 、 标 准 差 不 同 的 情况 下 ， 画 高 斯 分 布 的 图 像 ; 在 标准 差 固定 、 均 值 不 同 的 情况 下 ， 画 
高 斯 分 布 的 图 像 。 
为 StdRandom 添加 方法 exp0， 参 数 为 入， 返回 一 个 服从 参数 为 入 的 指数 分 布 的 随机 数 。 提 
示 : 如 果 x 是 在 0 和 1 之 间 均 匀 分 布 的 随机 数 ， 则 -lnx/ 入 就 是 参数 为 入 的 指数 分 布 返回 的 随 
机 数 。 
向 StdRandom 添加 一 个 静态 方法 maxwellBoltzmann()， 返 回 一 个 服从 参数 为 o 的 Maxwell- 
Boltzmann 分 布 的 随机 值 。 为 了 产生 这 样 的 值 ， 从 均值 为 0、 标 准 差 为 o 的 高 斯 分 布 得 到 三 个 
随机 数 ， 取 其 平方 和 的 平方 根 。 理 想 气体 中 分 子 的 速度 符合 Maxwell-Boltzmann 分 布 。 
修改 Bernoulli (程序 2.2.6 )， 以 动画 形式 生成 条 形 图 。 在 每 次 实验 后 重新 绘制 ， 以 便 你 可 
以 观察 它 收 敛 于 高 斯 分 布 。 然 后 添加 命令 行 参数 ， 用 于 设 定 硬币 正面 朝 上 的 概率 p， 并 重 载 
binomial() 的 实现 。 一 定 要 试 试 p 的 值 趋 近 0 以 及 趋 近 1 的 情况 。 
开发 StdArrayIO 的 所 有 实现 (实现 API 中 指出 的 所 有 12 种 方法 )。 
编写 一 个 实现 以 下 API 的 库 Matrix: 


public class Matrix 


double dot(double[] a, double[] b) 矢量 点 积 
double[][] multiply(double[][] a，double[][] b) 和 托 阵 -和 矩阵 积 
double[][] transpose(double[][] a) 转 置 


double[] multiply(double[][] a, double[] x) 和 矩阵 -向 量 积 
double[] multiply(double[] x, double[][] a) 和 问 量 -矩阵 积 


( 见 1.4 节 )。 作 为 测试 用 客户 程序 ， 使 用 以 下 代码 执行 与 Markov (程序 1.6.3 ) 相同 的 计算 : 


public static void main(String[] args) 

{ 
int trials = Integer.parseInt(args[0]); 
double[][] p = -StdArrayI0.readDouble2DO); 
double[] ranks = new double[p.length]; 
rank[0] = 1.0; 
for (int t = 0; t < trials; t++) 

ranks = Matrix.multiply(ranks, p); 

StdArrayI0.print(ranks); 


数学 家 和 科学 家 使 用 成 熟 的 库 或 特殊 用 途 的 矩阵 处 理 语言 完成 这 些 任 务 。 有 关 使 用 此 类 
库 的 详细 信息 请 参阅 本 书 官网 。 
编写 实现 1.6 节 中 描述 的 Markov 版 本 的 Matrix 客户 程序 ， 但 是 基于 和 矩 阵 平方 的 迄 代 ， 而 不 是 
向 量 -和 矩阵 相 乘 的 迭代 。 
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使 用 StdArrayIO 和 StdRandom 库 重 写 RandomSurfer (程序 1.6.2 )。 
部 分 代码 : 


double[][] p = StdArrayI0.readDouble2D(); 
int page = 0; // 从 第 0 页 开始 
int[] freq = new int[n]; 
for (int t = 0; t < trials; t++) 
{ 
page = StdRandom.discrete(p[page]); 
freq[page]++; 
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Sicherman 鹏 子 。 假 设 你 有 两 个 六 面体 仍 子 ， 一 个 是 标 有 1、3、4、5、6、8， 另 一 个 被 标记 
为 1、2、2、3、3、4。 将 仍 子 总 和 的 每 个 值 的 发 生 概率 与 标准 蜗 子 对 的 概率 进行 比较 。 使 用 
StdRandom 和 StdStats。 
催 子 。 深 动 两 个 六 面 山 子 ,x 为 它们 的 总 和 。 以 下 是 掷 蜗 子 游 戏 中 赌 赢 的 规则 。 
。 如 果 x 是 7 或 11, 你 赢 了 。 
。 如 果 x 为 2、3 或 12, 你 输 了 。 
否则 ， 重 复 滚动 两 个 崩 子 ， 直 到 它们 的 总 和 为 x 或 7。 
。 如 果 它 们 的 总 和 为 x， 你 赢 了 。 
。 如 果 它 们 的 总 和 是 7， 你 输 了 。 
编写 一 个 模块 化 程序 来 估计 赢得 赌注 的 可 能 性 。 然 后 ， 修 改 你 的 程序 来 处 理 以 下 情况 : 
假设 你 可 以 控制 骨 子 ， 从 命令 行 获取 角 子 获得 点 数 为 1 的 概率 ， 点 数 为 6 的 概率 为 /6 减 
去 该 概率 ， 点 数 2 一 5 被 假定 为 同等 可 能 ， 再 次 计算 不 同 参数 下 你 的 获胜 概论 。 提 示 : 使 用 
StdRandom.discrete()。 
高 斯 随机 数 。 使 用 Box-Muller 公式 ( 见 练习 1.2.27 ) 在 StdRandom (程序 2.2.1 ) 中 实现 无 参 
数 gaussian() 函数 。 接 下 来 ， 考 虑 一 种 称 为 Marsaglia 方法 的 替代 方法 ， 该 方法 的 思路 基于 在 
单位 圆 中 生成 随机 点 并 使 用 Box-Muller 公式 的 形式 进行 计算 (参见 1.3 节 结尾 处 的 do-while 
的 讨论 )。 
public static double gaussian©O 
: double r, x, y; 
do 
{ 
x = uniform(-1.0, 1.0); 
y = uniform(-1.0, 1.0); 
rr = Xx*X + y*y; 
}- while (r,>= 二 | 本 riss 0); 


return x * Math.sqrt(-2 * Math.log(r) / n); 
} 


对 于 每 种 方法 ， 从 高 斯 分 布 生成 1000 万 个 随机 值 ， 并 测量 哪 一 个 更 快 。 259 
动态 直方 图 。 假设 标准 输入 流 是 double 序列 。 编 写 一 个 程序 ， 它 从 命令 行 中 读 取 一 个 整数 n 

和 两 个 double 型 值 1o 和 hi。 把 (lo，hi) 分 割 为 n 个 相等 大 小 的 间隔 ,用 StdStats 画 一 个 直 

方 图 来 描述 标准 输入 流落 在 每 个 间隔 中 的 个 数 。 使 用 程序 将 代码 添加 到 练习 2:2.3 的 解决 方案 

中 ， 从 命令 行 读 和 人 ai， 并 绘制 每 个 方法 生成 的 数字 分 布 的 直方 图 。 
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压力 测试 。 开 发 一 个 对 StdStats 进行 压力 测试 的 客户 程序 。 与 同学 合作 ， 一 个 人 编写 代码 ， 另 
一 个 测试 它 。 

赌 徒 破产 问题 。 开 发 一 个 StdRandom 客户 程序 来 研究 赌 徒 破产 问题 ( 见 程序 1.3.8 和 练习 
1.3.24 一 1.3.25 ) 。 注 意 : 为 这 个 实验 定义 一 个 静态 方法 要 比 为 Bernoulli 定义 难 ， 因 为 你 不 能 
返回 两 个 值 。 

IFS。 实 验 IFS 的 各 种 输入 ， 以 创建 你 自己 的 设计 模式 ， 如 谢 尔 宾 斯 基 三 角形 、 巴 恩 斯 利 茧 类 
植物 或 文本 中 的 其 他 示例 。 你 可 以 从 修改 给 定 输入 开始 。 

IFS 矩阵 实现 。 编 写 使 用 Matrix 的 静态 方法 multiply() 的 IFS 版 本 (参见 练习 2.2.12 )， 而 不 是 
计算 x0 和 y0 的 新 值 的 方程 式 。 

整数 属性 库 。 根 据 我 们 在 本 书 中 考虑 的 用 于 计算 整数 属性 的 函数 来 开发 一 个 库 。 包 括 : 确定 给 
定 整数 是 否 为 质数 的 函数 ; 确定 两 个 整数 是 否 互 质 ; 计算 给 定 整数 的 所 有 因子 ; 计算 最 大 公约 
数 和 两 个 整数 的 最 小 公 倍数 ; 欧 拉 函数 (练习 2.1.26 ) ; 以 及 你 认为 可 能 有 用 的 任何 其 他 函数 。 
并 通过 重 载 给 出 long 型 数 的 实现 。 创 建 一 个 API、 执 行 压力 测试 的 客户 程序 ， 以 及 解决 本 书 
前 面 几 个 练习 问题 的 客户 程序 。 

音乐 库 。 根 据 PlayThatTune (程序 2.1.4 ) 中 的 函数 开发 一 个 库 ， 你 可 以 使 用 它 来 编写 客户 程 
序 以 创建 和 操作 歌曲 。 

投票 机 。 开 发 一 个 StdRandom 客户 程序 (具有 它 自 己 的 必要 的 静态 方法 ) 来 研究 以 下 问题 : 假 
设 在 一 亿 个 投票 人 中 , 51% 的 人 投 给 候选 人 A, 49% 的 人 投 给 候选 人 B。 但 投票 机 容 容易 出 错 ， 
5% 的 概率 会 产生 错误 的 统计 结果 。 假 设 这 些 错误 是 独立 的 、 随 机 的 ，5% 的 错误 率 是 否 会 使 
结果 无 效 ? 可 允许 的 最 大 错误 率 是 多 少 ? 

扩 克 分 析 。 写 一 个 StdRandom 和 StdStats 客户 程序 (具有 它们 自己 的 适当 的 静态 方法 )， 通 过 
模拟 计算 一 手 牌 (五 张 ) 中 ， 获 得 一 对 、 两 对 、 三 条 、 戎 芦 、 同 花 的 概率 (你 可 能 需要 自行 搜 
索 这 些 牌 的 具体 含义 一 一 译 者 注 )。 将 你 的 程序 划分 为 适当 的 静态 方法 ， 并 论述 你 的 设计 决策 
的 正确 性 。 加 分 题 : 在 概率 列表 中 添加 顺 子 和 同花顺 的 概率 。 

动画 图 。 编 写 一 个 程序 ， 该 程序 需要 输入 命令 行 参数 m， 并 生成 标准 输入 上 最 新 的 m 个 
double 型 数 的 条 形 图 。 使 用 与 BouncingBall (程序 1.5.6 ) 相同 的 动画 技术 : 擦 除 、 重 绘 、 显 
示 和 短暂 等 待 。 每 次 程序 读 取 一 个 新 的 数字 时 ， 都 应 该 重 绘 整个 条 形 图 。 由 于 图 片 的 大 部 分 
内 容 没 有 改变 ， 只 是 略微 向 左 移动 ， 你 的 程序 会 产生 一 个 固定 大 小 的 窗口 根据 输入 值 动态 滑 
过 的 效果 。 使 用 你 的 程序 绘制 大 规模 的 根据 时 间 变 化 的 数据 文件 ， 比 如 股票 价格 。 

数组 绘制 库 。 开 发 自己 的 绘图 方法 来 改进 StdStats 中 的 方法 。 要 有 创意 ! 尝试 制作 一 个 你 认为 
将 来 对 某 些 应 用 程序 有 用 的 绘图 库 。 


递归 


函数 可 以 调用 其 他 函数 ， 这 使 我 们 立即 想到 函数 还 可 以 调用 自身 。Java 和 大 多 数 现代 编程 
语言 一 样 ， 在 函数 调用 机 制 中 支持 函数 调用 自身 。 函 数 调用 自身 被 称 为 递归 ( recursion)。 在 本 节 
中 ,我 们 将 研究 各 种 问题 的 高 效 的 递归 解决 方案 。 递 归 是 在 本 书 中 经 常 使 用 的 强大 的 编程 技术 。 
递归 的 程序 通常 比 非 递归 程序 更 紧凑 、 更 易于 理解 。 很 少 有 程序 员 能 在 短 时 间 内 非常 熟练 地 使 用 
递归 ， 但 用 递归 解决 问题 会 是 令 人 满足 的 体验 ， 每 个 程序 员 都 可 以 有 这 样 的 体验 (你 也 可 以 ! )。 

递归 不 仅仅 是 编程 技术 。 在 许多 环境 中 ， 它 是 描述 真实 世界 的 有 效 方法 。 例 如 ， 递 归 树 
(下 图 ) 类 似 于 一 棵 真实 的 树 ， 并 且 具 有 自然 的 递归 特征 。 递 归 模 型 很 好 地 解释 了 许多 现象 。 
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递归 在 计算 机 科学 中 更 是 起 着 核心 作用 ， 它 提供 了 一 个 简单 的 计算 模型 ， 能 够 用 于 描述 任何 
可 以 用 计算 机 进行 计算 的 内 容 ; 它 帮助 我 们 组 织 和 分 析 程 序 ; 它 是 许多 重 
要 的 计算 应 用 的 关键 。 递 归 应 用 的 范围 很 广 ， 无 论 是 支持 信息 处 理 的 树 数 
据 结构 的 组 合 搜索 ， 还 是 用 于 信和 号 处 理 的 快速 传 里 叶 变 换 ， 都 可 以 使 用 递 
归 技 术 来 实现 。 
支持 递归 技术 的 一 个 重要 原因 是 它 提 供 了 一 种 简单 直接 的 方法 来 构建 
自然 界 的 递归 模型 数学 归纳 (mathematical induction) 的 模型 。 数 学 归纳 法 是 一 种 重要 的 数学 证 
明 手 段 ， 我 们 可 以 用 它 来 证 明 很 多 重要 的 定理 。 在 本 书 中 ， 我 们 不 再 详细 介绍 数学 证 明 ， 而 只 
强调 编程 的 方法 ， 但 是 你 们 有 必要 理解 这 一 过 程 ， 并 明白 递归 程序 在 这 一 过 程 中 的 执行 过 程 。 
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modern programming languages supports this Possibilty which is known as recur 
sion, In this section, we will study exam- 


Ples of elegant and efficient recursive so- 
lotions to a variety of problems. Once 
you get used to the idea, you will see that 
recursion is a powerful general-purpose 
programming technique with many at- 
tractive properties lt is a fundamental 

‘ool that we use often in this 


book. Recursive programs are 


often more compaut and easier to understuand than their nonrecursive 
counterparts. Few programmers become sufficiently comfortable with 
re ursion to us it In everyday code, but solving a problem with an cle- 





Bantly crafted recursive program a satisfying experience that s certain- 
1y accessible to cvery programmer (even you!). 

Reeursion is much more than a programming technique. ln many 
Settings, it is a useful way to describe the natural world. For example. the 
recursive tee (IO the Jefl) resembles 4 real tree, and has a natural recur- 
Sive description. Many, many phenomena are well explained by recursive 
models, In particular recursion plays a central role in computer science. 
Mt provides a simple computational model that embraces everything that can be 
computed with any computer; it helps us to organize and to analyze programs; and 
it is the key to numerous critically important computational applications, tanging 
from combinatorial search to tree data structures that support information pro- 


A Psirr mood 
of the natura! world 


es 下 aarir rr 
stand that point of view and to make the effort to convince yourself that recursive 
Pprograms have the intended effect 
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你 的 第 一 个 递归 程序 ”如 同 第 一 个 程序 通常 是 “Hello,World”， 第 一 个 递归 程序 通常 是 
计算 阶乘 (factorial) 函数 。 正 整数 的 阶乘 函数 定义 如 下 : 
nl=nX(n-1)X(n-2)X:……X2x1 
换 名 话说, nt 是 小 于 或 等 于 nn 的 正 整 数 的 乘积 。 现 在 ;使 用 for 循 环 计 算 很 容易 ， 
但 更 简单 的 方法 是 使 用 以 下 递归 函数 : 


public static long factorial(int n) 


jif_(Cn == 1) return 1; 
return n * factorial(n-1); 


} 


此 函数 调用 了 自身 ， 属 于 一 个 递归 程序 。 你 要 相信 它 确实 可 以 实现 我 们 想 要 的 功能 。 让 
我 们 来 分 析 这 个 过 程 ， 当 nn 为 1 时 ，factorial() 函数 返回 1， 这 是 个 正确 答案 ; 如 果 它 需要 计 
算 下 式 时 

Ge 1X (2 1 

那么 它 可 以 通过 下 面 的 式 子 正 确 地 计算 出 这 个 值 

nl=nX(n-1)!l=nX(n-1)X(n-2)X:……X2X1 

为 了 计算 factorial(5)， 北 归 函 数 将 5 与 factorial(4) 相 乘 ; 计算 factorial(4)， 将 4 与 
factorial(3) 相 乘 ; 以 此 类 推 。 这 个 过 程 一 直 重 复 ， 直 到 调用 参数 foctorialcs) 

为 1 时 ，factorial(1) 直接 返回 1。 我 们 追溯 这 一 系列 的 函数 调用 即 “Riceorjald3) 


追踪 了 整个 计算 过 程 。 如 果 我 们 将 所 有 被 调用 的 函数 视 为 相互 独 有 
立 的 代码 副本 ,那么 ， 它 们 是 否 是 递归 也 就 没有 本 质 区 别 。 ee 
factorial() 函数 的 实现 展示 了 每 个 递归 函数 所 需 的 两 个 主要 部 TD 


分 。 首 先 ， 函 数 的 基础 步骤 是 在 没有 任何 递归 调用 的 情况 下 返回 Te 

一 个 值 。 基 础 步骤 可 以 是 对 一 个 或 多 个 特殊 的 输入 值 的 操作 ， 可 ”factorial(5) 的 函数 调用 追踪 
以 在 不 递归 的 情况 下 对 该 函数 进行 求 值 。 对 于 factorial() 函数 ， 基 础 步骤 为 n=1。 其 次 是 归 
约 步 骤 (reduction step)， 这 是 递归 函数 的 核心 部 分 。 它 将 函数 的 一 个 (或 多 个 ) 参数 的 调用 
转换 成 该 函数 的 男 一 个 (或 多 个 ) 参数 的 调用 ， 以 及 其 他 相关 联 的 
计算 。 对 于 factorial() 也 数 ， 归 约 步骤 是 通过 n* factorial(n-1) 实现 
的 。 所 有 递归 函数 必须 具有 这 两 个 部 分 。 此 外 ， 参 数值 序列 必须 收 
敛 到 基础 步骤。 对 于 factorial() 函数 ， 每 个 调用 之 后 n 减 少 1， 因 5 3120 


6 720 
此 参数 值 序列 收敛 到 最 后 是 n=1。 7 5040 
8 40320 


如 果 我 们 将 归 约 步骤 放 在 else 子 句 中 ， 那 么 像 factorial() 这 样 9 362880 
的 小 程序 可 能 会 变 得 更 加 清晰 。 然而 ， 在 递归 程序 中 进行 这 样 的 修 ”10 3628800 


改 并 不 一 定 是 个 好 主意 。 因 为 对 于 稍微 复杂 的 程序 ， 绝 大 部 分 代码 ”12 479001600 
都 是 归 约 步骤 ， 按 照 这 样 修改 后 ， 这 些 代码 将 放 在 else 后 的 大 括号 14 83178291200 


内 执行 ， 只 会 使 程序 变 得 复杂 而 毫 无 收益 。 我 们 建议 采用 以 基础 步 。15 1307674368000 
16 20922789888000 


又 作为 第 一 个 语句 9 以 返回 作为 结尾 ， 然后 将 其 余 代码 用 于 归 约 步 17 355687428096000 
又 ,这样 的 表示 更 加 清晰 简练 。 18 6402373705728000 
19 121645100408832000 


factorial() 的 实现 本 身 在 实践 中 不 是 特别 有 用 ， 因 为 n! 增 长 过 20 2432902008176640000 
快 ， 乘 法 将 溢出 ， 并 且 在 n>20 时 会 产生 不 正确 的 答案 。 但 同样 的 nl! 的 求解 过 程 
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技术 能 有 效 地 计算 各 类 函数 。 例 如 递归 函数 


public static double harmonic(int n) 
{ 

if (n ==*1) return 1.0; 

return harmonic(n-1) + 1.0/n; 


这 是 一 个 用 于 当 埃 较 小 时 计算 谐 波 数 的 程序 〈 见 程序 1.3.5)， 其 计算 公式 如 下 : 
H, = 1+1/2+:**+1/n 
= (1+1/2+*…+1/(n—1)+1/n 
= Ft1/n 

实际 上 ， 对 于 任何 可 以 写 出 紧凑 公式 的 任何 离散 求 和 (或 求 乘积 ) 的 运算 ， 都 可 以 用 同 
样 的 方法 计算 ， 而 且 只 需要 几 行 代码 。 像 这 样 的 递归 函数 看 起 来 像 循环 结构 ， 但 递归 确实 可 
以 帮助 我 们 更 好 地 了 解 计 算 的 过 程 。 

数学 归纳 法 ”递归 编程 与 数学 归纳 法 直接 相关 ， 数 学 归纳 法 是 一 种 广泛 用 于 自然 数 的 
技术 。 

通过 数学 归纳 法 证 明 一 个 包含 有 整数 的 命题 为 真 (假设 n 有 无 限 多 个 值 )， 包括 以 下 
两 个 步 又 : 

。 基础 步骤 : 证 明 nn 为 某 些 特定 值 (通常 为 0 或 1) 时， 命题 为 真 。 

。 归纳 步骤 (证明 的 中 心 部 分 ); 假定 对 于 所 有 小 于 n 的 正 整数 命题 为 真 ， 据 此 推断 出 

整个 命题 为 真 。 

这 样 足 以 证 明 ， 对 于 n 的 无 穷 多 值 ， 该 命题 为 真 : 我 们 可 以 从 基础 步骤 开始 ， 对 于 每 一 
个 基础 步骤 的 n， 逐 一 证 明 命题 为 真 。 

对 于 数学 归纳 法 的 学 习 我 们 通常 从 以 下 命题 开始 : 所 有 小 于 或 等 于 n 的 正 整数 的 和 是 
n(n+1)/2。 即 : 我 们 需要 证 明 当 nn 三 1 时 ， 以 下 公式 成 立 : 

1+2+3+*…+(n—1)+n=n(n+1)/2 

因为 1=1(1+1)/2， 所 以 对 于 n=1 (基础 步骤 )， 这 个 公式 是 成 立 的 。 如 果 我 们 假设 对 于 小 
于 nn 的 所 有 正 整 数 都 是 成 立 的 ， 即 对 于 n-1 的 情况 也 是 成 立 的 ， 所 以 

1+2+3+.%:+(n=1)=(n-1)n/2 

我 们 可 以 将 n 加 到 这 个 公式 的 两 边 ;， 并 化 简 就 得 到 所 需 公 式 (归纳 步 骤 )。 

每 次 编写 一 个 递归 程序 时 ， 我 们 需要 通过 数学 归纳 法 来 确信 该 程序 具有 预期 的 效果 。 
归纳 和 递归 之 间 的 对 应 关系 是 不 言 而 喻 的 a 而 命名 的 差异 表明 了 其 侧重 点 的 不 同 : 在 递归 
程序 中 ,我 们 的 目的 是 通过 归 约 到 较 小 问题 来 完成 计算 ， 因 此 我 们 使 用 术语 归 约 步骤 ; 在 
归纳 证 明 中 ， 我们 的 目的 是 为 了 确定 较 大 问题 的 命题 的 真实 性 ， 所 以 我 们 使 用 术语 归纳 
步骤 。 

当 编写 递归 程序 时 ， 我 们 通常 不 会 写 出 一 个 完整 的 正式 的 证 明 过 程 来 证 明 它们 产生 了 所 
需 的 结果 ， 但 是 我 们 总 是 假设 已 经 做 过 了 一 个 类 似 这 样 的 证 明 。 事 实 上 ， 我 们 经 常 需要 一 个 
非 正 式 的 归纳 证 明 使 自己 相信 ， 递 归程 序 能 够 按 预 期 工作 。 例 如 ， 我 们 刚刚 讨论 了 一 个 非 正 
式 的 证 明 ， 以 确信 factorial() 可 计算 小 于 或 等 于 的 正 整数 的 乘积 。 
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程序 2.3.1 欧 几 里 得 算法 





public class Euclid 









public static int gcd(int p, int q) 
p,q 参 


参 
divisor 最 






数 
大 公约 数 





if (q == 0) return p; 
return gcd(q, p % q); 








public static void main(String[] args) 


% java Euclid 1440 408 









int p = Integer.parseInt(args[0]); 
int q = Integer.parseInt(args[1]); 
int divisor = gcd(p, q); 


% java Euclid 314159 271828 
A 本 
StdOut.printin(divisor); 















这 个 程序 给 出 了 欧 几 里 得 算法 的 递归 实现 ， 以 计算 两 个 命令 行 参数 的 最 
大 公约 数 。 


欧 几 里 得 算法 ”两 个 正 整 数 的 最 大 公约 数 ( greatest common divisor，gcd) 是 能 同时 整 
除 这 两 个 数字 的 最 大 整数 。 例 如 ，102 和 68 的 最 大 公约 数 是 34， 因 为 102 和 68 都 是 34 的 
倍数 ， 且 没有 大 于 34 的 整数 能 同时 整除 102 和 68。 在 学 习 分 数 化 简 的 时 候 ， 你 可 能 已 经 学 
习 过 最 大 公约 数 了 。 例 如 ， 我 们 可 以 通过 将 分 子 和 分 母 除 以 34 ( 68 和 102 的 最 大 公约 数 ) 
来 简化 68/102 到 2/3。 查 找 较 大 整数 的 最 大 公约 数 是 许多 商业 应 用 中 的 重要 问题 ， 包 括 著名 
的 RSA 密码 系统 。 

对 于 正 整数 p 和 4， 计 算 其 最 大 公约 数 时 遵循 以 下 定理 : 

如 果 p>qg, p 和 9g 的 最 大 公约 数 等 于 gq 和 p%g 的 最 大 公约 数 。 

为 了 证 明 上 述 定理 ， 首 先 , p 和 9g 的 最 大 公约 数 等 于 g 与 p-g 的 最 大 公约 数 ， 因 为 当 且 
仅 当 一 个 数字 能 够 同时 整除 4 和 p-g 时， 它 才 能 同时 整除 p 和 gqg。 按 照 这 样 的 推断 过 程 ，g 
和 p-29、gq 和 p-39 等 应 具有 相同 的 最 大 公约 数 ， 并 且 计 算 p%g 的 一 种 方法 是 从 p 中 不 断 减 
去 4 直到 得 到 小 于 9 的 数字 。 

Euclid (程序 2.3.1 ) 中 的 静态 方法 gcd() 是 一 个 紧凑 的 递归 ucdclaao，4o8) 
函数 ， 其 归 约 步骤 基于 上 述 推断 过 程 。 基 础 步骤 为 : 当 g 为 0 时 ， We R20) 


gcd(216, 192) 


gcd(p, 0)=p。 可 以 看 到 ， 每 次 递归 调用 时 ， 只 要 还 满足 p%gq<g， gcd(192, 24) 
第 二 个 参数 的 值 就 会 严格 递 减 ， 直 到 归 约 步 又 收敛 到 基础 步 又 。 让 
如 果 <g， 第 一 个 递归 调用 会 有 效 地 切换 了 两 个 参数 的 顺序 。 实 nb 
际 上 ， 第 二 个 参数 值 在 每 一 次 递归 调用 时 都 至 少 减少 2 的 倍数 ， return 24 


所 以 参数 值 序列 很 快 收 伊 到 基础 步骤 (参见 练习 2.3.11 )。 这 个 计 "eturn 24 
算 最 大 公约 数 的 递归 解决 方案 被 称 为 欧 几 里 得 算法 ， 欧 几 里 得 算 ”9cd() 的 函数 调用 跟踪 
法 是 最 古老 的 算法 之 一 ， 迄 今 已 有 2000 多 年 的 历史 。 

汉 诺 塔 ”每 一 次 对 递归 话题 的 讨论 ， 都 不 可 避免 地 会 提 到 古老 的 汉 诺 塔 ( towers of 
Hanoi) 问题 。 所 谓 汉 诺 塔 问题 ， 就 是 假设 有 三 根 柱子 和 个 圆 盘 ， 圆 盘 套 在 柱子 上 。 圆 盘 
大 小 不 同 ， 最 初 所 有 的 圆 盘 都 套 在 -- 根 柱子 上 ， 按 照 从 大 到 小 的 顺序 排列 ， 底 部 是 最 大 的 贺 
盘 ( 圆 盘 m)， 顶 部 是 最 小 的 圆 盘 ( 圆 盘 1 )。 我 们 任务 是 将 所 有 n 个 圆 盘 移动 到 另 一 个 柱子 
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上 ， 同 时 遵守 以 下 规则 : 
。 一 次 只 移动 一 个 圆 盘 。 
。 不 要 把 大 圆 盘 放 在 小 圆 盘 上 。 
传说 当 僧 侣 们 在 三 根 销 石 针 的 64 个 金色 圆 盘 上 完成 这 项 任务 时 ， 就 是 世界 的 末日 。 但 
是 僧侣 们 怎样 才能 按照 规则 来 完成 这 项 任务 呢 ? 
为 了 解决 这 个 问题 ， 我 们 的 目标 是 发 布 一 系列 移动 圆 盘 的 指令 。 我 们 假设 柱子 排列 成 一 
行 ， 并且 每 个 指令 移动 指定 数量 的 圆 盘 向 左 或 向 右 。 如 果 圆 盘 位 于 最 左 侧 柱子 ， 向 左 移 动 意 
味 着 圆 盘 会 回 绕 到 最 右 侧 的 柱子 上 ; 如 果 圆 盘 位 于 最 右 侧 柱 子 ， 则 向 右 移动 意味 着 圆 盘 会 回 
绕 到 最 左 侧 的 柱子 上 。 当 圆 盘 全 部 在 一 侧 时 ， 有 两 个 可 执行 的 操作 ;” 向 左 或 向 右 移 动 最 小 的 
圆 盘 ; 如 果 圆 盘 并 不 是 都 在 一 侧 ， 则 有 三 种 可 执行 的 操作 : 向 左 或 向 右 移动 最 小 的 圆 盘 ， 或 
在 其 他 两 侧 的 柱子 之 间 进 行 合理 的 移动 。 为 了 实现 目标 而 精心 计算 每 一 步 移 动 ， 这 确实 是 一 
个 挑战 。 借 助 递 归 ， 我 们 可 以 根据 下 面 的 计划 来 完成 这 个 复杂 的 任务 : 首先 我 们 将 顶部 的 
1-1 个 圆 盘 移动 到 一 个 空 柱子 上 ， 然 后 我 们 将 底部 最 大 的 圆 盘 移 动 到 另 一 个 空 柱子 上 (不 影 
响 较 小 的 圆 盘 )， 然 后 我 们 通过 将 n-1 个 圆 盘 移动 到 最 
大 的 圆 盘 所 在 的 那 根 柱子 来 完成 这 项 工作 。 
TowersOfHanoi ( 见 程序 2.3.2 ) 是 这 种 递归 策略 
的 直接 实现 。 它 需要 一 个 命令 行 参数 n， 然 后 可 以 输出 
"个 汉 诺 塔 圆 盘 的 解决 方案 。 其 中 ， 递 归 函 数 movesQ 将 "1 辑 盘 移动 到 右 侧 柱子 上 《递归 起) 
会 输出 一 系列 移动 指令 ,将 圆 盘 向 左 (如果 参数 left 为 
true) 或 向 右 (如 果 left 为 false) 移动 ， 并 且 移 动 的 过 
程 完全 遵循 上 述 方案 的 要 求 。 
函数 调用 树 ”为 了 更 好 地 理解 具有 多 个 递归 的 函 将 最 大 的 圆 盘 左 移 ( 回 绕 到 最 右 侧 的 柱子 上 ) 
数 调 用 (如 TowersOfHanoi) 的 程序 的 行为 ， 我 们 用 函 
数 调 用 树 (function-call tree) 来 提供 一 种 可 视 化 的 表 
示 方 法 。 具 体 来 说 ， 我 们 将 每 个 方法 调用 视 为 树 节点 一 一 一 -一 
(tree note)， 用 圆圈 表示 ， 每 个 圆圈 里 标注 函数 调用 的 生 ， 国生 和 和 有 这 (再) 
参数 的 值 。 在 每 个 树 节 点 下 面 ， 我 们 绘制 对 应 每 个 函 
数 调用 的 子 节 点 〈 从 左 到 右 )， 用 线 将 树 节点 和 子 节点 
连接 起 来 。 该 图 包含 了 我 们 需要 了 解 程序 如 何 工作 的 有 
所 有 信息 ， 并 包含 每 个 函数 调用 的 节点 。 本 辣 昌 的 滞 甩 来 现 


开始 位 置 








程序 TowersOfHanoi 中 moves(4, true) 的 函数 调用 树 


我 们 可 以 使 用 函数 调用 树 来 了 解 所 有 模块 化 程序 的 行为 ， 它 们 对 分 析 弟 归程 序 的 行为 
大 有 和 帮助。 例如， 与 TowersOfHanoi 中 的 move() 相对 应 的 树 很 容易 构建 。 首 先 绘制 一 个 树 
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L269| 节点 ， 用 命令 行 参数 的 值 标注 。 第 一 个 参数 是 要 移动 的 圆 盘 数 (以 及 要 实际 移动 的 圆 盘 标 


签 ); 第 二 个 参数 是 移动 圆 盘 的 方向 。 为 了 清楚 起 见 ， 我 们 用 向 左 或 向 右 的 箭头 描述 方向 ( 布 
尔 值 )， 这 样 我 们 可 以 将 值 与 方向 联系 起 来 。 然 后 在 下 面 绘制 两 个 树 节点 ， 圆 盘 数 减 1， 方 向 
切换 重复 上 述 过 程 ， 直 到 所 有 树 节 点 的 值 为 1， 且 它 的 下 面 没有 子 节点 ， 这 些 节 点 对 应 于 
move() 的 调用 不 会 再 有 后 续 的 递归 调用 。 


程序 2.3.2 汉 诺 塔 问题 





public class TowersOfHanoi 
{ 


public static void moves(int n, boolean left) 
{ 


if Cn == 0) return; tt p 数量 a 
moves(n-1, !left); eft | 圆 盘 移动 方向 
if (left) StdOut.printin(n + " left"); 

else StdOut.printin(n + " right"); 

moves(n-1, !left); 


和 

public static void main(String[] args) 

{ // 读 到 n， 输出 将 n 个 略 盘 向 左 移动 的 指令 
int m = Integer.parseInt(args[0]); 
moves(n, true); 


} 
和 
递归 方法 move(0 输 出 将 n 个 圆 盘 向 左 - 如 果 left 为 真 ) 或 向 有 ( 如 果 left 为 
假 ) 移动 的 指令 。 

% java TowersOfHanoi 1 % java TowersOfHanoi 4 

1 left 1 right 

% java TowersOfHanoi 2 2 left 

1 right 1 right 

2 eft 3 right 

1 right 1 right 

% java TowersOfHanoi 3 2 left 

1 left gt 

2 right | 4 ]eft 

1 left ES 

3 left 了 

1 left 1 right 

2 right 3 right 
1 right 

1 lef 

hs 2 Teft 

1 right 


将 本 节 前 面 描述 的 函数 调用 树 ， 与 描述 的 相应 函数 调用 轨迹 进行 比较 ， 你 会 发 现 函 数 调 
用 树 只 是 函数 调用 轨迹 的 简化 形式 ,而 从 左 到 右 的 节点 标签 即 是 解决 问题 的 移动 指令 。 

此 外 ， 当 你 学 习 树 时 ， 你 可 能 会 注意 到 几 个 特点 ， 其 中 包括 以 下 两 个 : 

。 每 隔 一 次 即 需要 移动 最 小 圆 盘 。 

。 圆 盘 总 是 沿 相同 方向 移动 。 

这 些 特点 至 关 重 要 ， 因 为 不 需要 递归 (甚至 是 计算 机 ) 它们 就 可 以 解决 问题 : 每 隔 一 次 
即 需 要 移动 最 小 圆 盘 〈 包 括 第 一 个 和 最 后 一 个 )， 那 么 ， 每 个 不 涉及 最 小 圆 盘 的 移动 是 唯一 
有 效 的 移动 。 我 们 可 以 证 明 ， 这 种 方法 产生 的 结果 与 递归 程序 的 结果 相同 。 几 个 世纪 以 前 
(还 没有 计算 机 )， 也 许 僧侣 们 使 用 的 就 是 这 种 方法 。 


戈 痢 和 嫉 块 1 


a 
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函数 调用 树 在 理解 递归 中 是 非常 重要 的 ， 因 为 其 本 身 就 是 一 个 典型 的 递归 对 象 。 树 作为 


抽象 的 数学 模型 ， 在 许多 应 用 中 起 着 至 关 重 要 的 作 
用 。 稍 后 在 第 4 章 中 , 我们 将 考虑 使 用 树 作 为 计算 模 
型 ， 来 构建 高 效 的 数据 结构 。 

指数 级 时 间 ”使 用 递归 的 一 个 优点 是 ， 我 们 经 常 
可 以 构建 数学 模型 以 推理 或 者 证 明 递 归程 序 中 一 些 我 
们 感 兴趣 的 属性 。 例 如 ， 对 于 汉 诺 塔 问题 ， 我 们 就 可 
以 构建 数学 模型 以 估计 到 世界 末日 的 时 间 (假设 传说 
是 真 的 )。 这 个 问题 很 重要 ,不 仅仅 是 因为 它 告诉 我 
们 世界 的 尽头 是 相当 遥远 的 (即使 传说 是 真实 的 )， 而 
且 因 为 它 提供 给 我 们 一 些 启发 ， 帮 助 我 们 避免 编写 直 
到 那 时 才能 运行 完 的 程序 。 

汉 诺 塔 问题 的 数学 模型 很 简单 : 如 果 我 们 将 函数 
7T(n) 定义 为 由 TowersOfHanoi 解决 n 个 圆 盘问 题 所 需 
要 移动 的 步 数 ， 则 递归 代码 意味 着 7T(n) 必须 满足 以 下 
等 式 : 

7T(n)=27T(n-1)+1， 当 n>1 时 

f 当 n=1 时 

这 个 方程 在 离散 数学 中 被 认为 是 一 种 递 推 关系 
(recurrence relation)。 在 研究 递归 程序 时 自然 会 出 现 递 
推 关 系 ， 通 过 递 推 关 系 ， 我们 可 以 推导 出 与 直接 相 
关 的 、 闭 合 形式 的 表达 式 。 对 于 T(n)， 我 们 可 以 从 前 
面 的 几 个 值 7(1)=1，7(2)=3，7T(3)=7 和 7(4)=15， 猜 测 
7(n)=2”-1。 通 过 数学 归纳 法 ， 可 以 证 明 该 猜测 为 真 : 

。 基础 步骤 : T(D)=2"-1=1 

e。 归纳 步骤 : 如 果 7T(n-=1)=2”'-1,，T(n)=2(2"'= 

1)+1=2 一 1 
因此 ， 通 过 归纳 ， 对 于 所 有 xz>0，7T(UD)=2-1。 圆 


moves(4，tru 


e) 
moves(3, false) 
moves(2, true) 
moves(1, false) 
1 right 


2 left 
moves(1, false) 


1 right 


3 right 
moves(2, true) 
moves(1, false) 
1 right 


2 left 


moves(1, false) 
1 right 


-EEEEEEE 


3 个 圆 盘 移 到 右边 


4 left | : | 
moves(3, false) 第 4 个 圆 盘 移 到 左边 
moves(2，true) 
moves(1，false) 
moves(1, false) | | | 
3 right = 
moves(2, true) 
moves(1, false) | | 
1 right 
2 left 」] 上 扣 
moves(1， false) | > 
3 个 圆 盘 移 到 右边 
moves(4,true) 函数 的 调用 轨迹 


盘 移 动 的 最 小 可 能 步 数 也 满足 该 递 推 关系 (参见 练习 2.3.11 ) 。 

已 知 T(n) 的 值 ， 我 们 可 以 估计 执行 所 有 移动 所 需 的 时 间 。 如 果 僧侣 以 每 秒 移动 1 个 圆 
盘 的 速度 ， 则 他 们 需要 一 个 多 星期 才能 完成 20 个 圆 盘问 题 ， 超 过 34 年 才能 完成 30 个 圆 盘 
问题 ， 超 过 348 个 世纪 ， 才 能 完成 40 个 圆 盘 的 问题 〈 假 设 他 们 没有 犯错 误 )。 而 完成 64 个 
圆 盘 问题 将 需要 58 亿 多 个 世纪 。 僧 侣 们 不 能 借助 程序 2.3.2， 也 就 无 法 如 此 快速 地 移动 圆 盘 
或 者 快速 找 出 接 下 来 移动 哪个 圆 盘 ， 那 么 世界 末日 还 要 更 遥远 。 

即便 是 计算 机 的 计算 速度 也 不 能 与 指数 级 增长 的 运算 量 相 匹配 。 比 如 说 ， 每 秒 可 以 进行 
十 亿 次 操作 的 计算 机 ， 仍 然 需要 数 百 年 的 时 间 才 能 进行 2“ 次 操作 ， 目 前 还 没有 计算 机 人 能够 
执行 2 次 操作 。 这 个 教训 是 深刻 的 : 通过 递归 ， 你 可 以 轻松 编写 需要 运行 指数 级 时 间 的 
简短 程序 ,但 是 当 你 尝试 使 用 较 大 的 n 运行 程序 时 ， 它 们 则 无 法 完成 运行 。 新 手 们 经 常 对 这 
个 基本 事实 持 怀疑 态度 ， 现 在 可 以 停 下 来 做 如 下 实验 : 将 打印 语句 从 程序 TowersOfHanoi 中 
删 掉 后 运行 ，n 从 20 开始 逐渐 增加 。 很 容易 得 出 ， 每 次 将 的 值 增加 1 运行 时 间 会 加 倍 ， 
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而 你 会 很 快 失去 耐心 等 待 程序 完成 。 对 于 某 个 n 值 ， 如 果 你 需要 等 待 一 个 小 时 ; 


n+5， 你 将 多 等 一 天 ; 对 于 n+t10， 你 将 多 等 一 个 月 ; 对 于 n+20,， 你 将 多 等 一 个 
世纪 ,然而 没有 人 能 等 那么 久 。 计 算 机 的 速度 没有 快 到 可 以 运行 你 编写 的 每 个 
Java 程序 ， 无 论 程 序 可 能 看 起 来 多 么 简单 ! 请 注意 那些 需要 指数 级 时 间 的 程序 。 

我 们 常常 希望 能 够 预测 我 们 程序 的 运行 时 间 。 在 4.1 节 中 ,我 们 将 讨论 我 
们 刚才 用 来 估算 其 他 程序 运行 时 间 的 过 程 。 

格雷 码 ” 汉 诺 塔 问题 不 是 游戏 ， 它 与 用 于 数字 编码 和 离散 对 象 处 理 的 基本 
算法 密切 相关 。 下 面 我 们 再 来 看 一 个 例子 一 一 格雷 码 ， 一 个 广泛 应 用 的 数学 抽 
象 概念 。 

剧 作 家 塞 缘 尔 : 贝克 特 (Samuel Beckett) 的 作品 《等 待 欧 多》 闻名 世界 ， 
他 还 写 过 一 个 戏剧 ， 名 为 Quad : 在 一 个 空白 的 舞台 上 ， 每 次 仅 能 有 一 个 角色 
进入 或 者 退出 舞台 ， 而 每 次 留 在 舞台 上 的 演员 组 合 不 能 重复 ， 贝 克 特 应 该 如 何 
为 这 个 戏剧 规划 出 舞台 指令 ? 

表示 n 个 离散 对 象 的 子 集 的 常用 方法 是 使 用 一 个 n 位 字符 串 ， 每 一 位 对 应 
一 个 对 象 的 状态 。 对 于 贝克 特 的 这 个 问题 ， 我 们 使 用 一 个 4 位 字符 串 ， 位 数 从 右 
到 左 ， 位 值 为 1， 表示 该 演员 在 舞台 上 ， 为 0 则 表示 不 在 。 例 如 ， 字 符 串 0101 


那么 对 于 


(30,'230) 








表示 演员 3 和 1 在 舞台 上 。 这 个 表示 方法 快速 地 证 明了 一 个 基本 事 编 本 j 指令 


实 : n 个 对 象 有 2 个 不 同 子 集 ，Quad 有 4 个 字符 ， 所 以 有 24=16 个 








0000 
0001 enter 1 
不 同 集合 。 我 们 的 任务 是 规划 舞台 指令 。 0011 21 enter2 

二 个 位 二 进 制 的 格雷 码 包含 了 2" 个 不 同 的 二 进 制 数 ， 这 些 0110 ,3,27 enter 3 
数字 组 成 一 个 列表 ， 列 表 中 的 每 一 个 数字 都 与 上 一 个 数字 仅 有 一 位 0101 31 eit? 
存在 差异 。 格 雷 码 可 以 直接 应 用 于 贝克 特 的 问题 ， 将 一 个 二 进 制 位 1100 43 ep 
的 值 从 0 改 为 1 对 应 于 一 个 演员 进入 舞台 ; 从 1 更 改 为 0 对 应 演员 - 1111 4321 enter2 
退出 舞台 。 Ea 

那 我 们 如 何 生成 格雷 码 呢 ” 与 解决 汉 诺 塔 问题 时 非常 相似 , 我 1081 "41 “er3 
们 仍 可 以 使 用 递归 方案 。n 位 二 进 制 的 格雷 码 按 递归 方式 定义 如 下 : 了 ””” “ 

。(n-1 ) 位 的 格雷 码 ， 在 前 面 加 一 位 0。 格雷 码 示意 图 

。 然 后 是 (n-1) 位 的 格雷 码 逆 序 排列 ， 在 前 面 加 一 a 人 

位 1。 + : 

0 位 的 格雷 码 被 定义 为 空 ， 因 此 1 位 的 格雷 码 是 0 和 1。 2 0 从 9|001 
根据 这 个 递归 定义 ,我们 可 以 通过 数学 归纳 法 证 明 ， 这 样 的 编 1 Re 0010 
码 方式 符合 格雷 码 的 要 求 : 任意 相 邻 的 两 行 代 码 只 有 一 位 代码 (逆序 排列 )。 0|1 1 
不 同 。 证 明 的 过 程 非常 容易 ， 根 据 归纳 假设 ， 显 然 前 半 部 分 人 | 
和 后 半 部 分 都 可 以 使 命题 成 立 ， 而 上 半 部 分 的 最 后 一 行 编码 ”3 Hi 
和 下 部 分 的 第 一 行 编码 只 有 第 一 位 不 同 ， 因 此 整体 命题 为 真 。 和 i 引 0 

经 过 仔细 思考 ,我 们 根据 递归 定义 可 以 写 出 程序 SN 
Beckett (程序 2.3.3 )， 并 输出 贝克 特需 要 的 舞台 指令 。 这 个 9 
程序 与 程序 TowersOfHanoi 非常 相似 。 的 确 ， 除 命名 之 外 ， 这 让 有 
唯一 的 区 别 是 递归 调用 中 第 二 个 参数 的 值 ! ( 通 冯 排列 (地 序 排列 ) 


与 TowersOfHanoi 的 指令 一 样 ，Beckett 出 入 舞台 的 2 位 、3 位 、4 位 格雷 码 
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enter 和 exit 指令 是 多 余 的 ， 因 为 只 有 当 演 员 在 舞台 上 时 才 会 执行 exit 操作 ， 只 有 当 演 员 不 
在 舞台 上 时 才 执 行 enter 操作 。 事 实 上 ，Beckett 和 TowersOfHanoi 都 与 我 们 在 第 1 章 学 习 的 
ruler 函数 (程序 1.2.1 ) 有 很 密切 的 关系 。 去 掉 打 印 指令 之 后 ,它们 都 是 一 个 简单 的 递归 函 
数 ， 可 以 用 来 在 Ruler 程序 中 根据 命令 行 参数 计算 出 标尺 上 的 刻度 线 长 度 。 

格雷 码 有 许多 应 用 ， 包 括 从 模 - 数 转换 器 到 实验 设计 。 它 们 已 经 用 于 脉冲 代码 通信 、 逻 
辑 电路 的 最 小 化 和 超 立 体 架 构 ， 甚 至 被 建议 用 于 组 织 图 书馆 书架 上 的 书籍 。 









程序 2.3.3 ”格雷 码 


public class Beckett 
{ 





public static void moves(int n, boolean enter) 
if (n == 0) return; 2 演员 人 数 
moves(n-1, true); enter | 舞台 指令 
if (enter) StdOut.printin("enter " + n); 


else StdOut.printin("exit ”+ n); 
moves(n-1, false); 



















} 


lic static void main(String[] args) 





pub 
{ 





int n = Integer.parseInt(args[0]); 
moves(n, true); 
} 
} 








这 个 递归 程序 输出 贝克 特 所 需 的 舞台 指令 (二进制 表示 的 格雷 码 位 的 变 
化 表示 舞台 的 进入 和 退出 指令 ) 。 ruler 函 数 精确 地 描述 了 位 的 变化 , 并 且 ( 当 
然 ) 也 描述 了 每 个 演员 交替 进入 和 退出 的 指令 。 











% java Beckett 1 
enter 1 


% java Beckett 4 
enter 1 


















% java Beckett 2 enter 2 
enter 1 exit 1 
enter 2 enter 3 
exit 1 enter 1 
% java Beckett 3 exit 2 
enter 1 exit 1 
enter 2 enter 4 
exit 1 enter 1 
enter 3 enter 2 
enter 1 exit 1 
exit 2 exit 3 
exit 1 enter 1 

exit 2 

exit 1 


- 递归 图 形 简单 的 递归 绘制 方案 可 以 绘制 复杂 的 图 像 。 递 归 制 图 不 仅 涉及 许多 应 用 ， 还 
为 更 好 地 理解 递归 函数 的 属性 提供 了 一 个 有 趣 的 平台 ， 因 为 借 此 我 们 可 以 观察 递归 图 像 的 生 
成 过 程 。 

下 面 我 们 给 出 第 一 个 简单 的 例子 一 一 Htree (程序 2.3.4 )， 给 定 一 个 命令 行 参数 n， 绘 制 
一 个 n 阶 吾 树 。n 阶 H 树 的 定义 如 下 : 

1 ) 基础 步 又: 当 n=0 时 ， 不 绘制 任何 东西 。 

2 ) 归 约 步骤 : 在 单位 正方 形 内 绘制 。 

。 字母 H 形状 的 三 条 线段 
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。 分别 以 字母 百 的 4 个 顶端 为 中 心 绘制 4 棵 三 1 阶 的 吾 树 ， 附 加 条 件 是 z-1 阶 的 互 树 


的 大 小 是 刚刚 绘制 的 一 半 。 

像 这 样 的 图 有 很 多 实际 应 用 。 例 如 ， 假 设 一 个 有 线 电视 公司 要 将 自己 
的 线 缆 连 接 到 其 所 在 地 区 的 所 有 家 庭 ， 合 理 的 策略 是 使 用 互 树 将 信号 发 送 
到 分 布 在 整个 区 域 的 若干 个 中 心 节点 ， 然 后 将 线 缆 从 距离 最 近 的 中 心 节点 
连接 到 每 个 家 庭 。 计 算 机 设计 人 员 想 要 在 整个 集成 电路 芯片 中 分 配 电源 或 
信号 时 ， 面 临 的 是 同样 的 问题 。 

虽然 每 次 绘制 都 是 在 指定 大 小 的 区 域内 完成 的 ， 但 是 H 树 一 定 会 旦 指 
数 级 增长 。n 阶 耳 树 会 连接 4” 个 中 心 。 当 n=10 时 ， 你 将 会 绘制 一 百 多 万 条 
线 ; 当 n=15， 你 将 会 绘制 十 亿 多 条 线 ; 当 n=30 时 ， 你 的 程序 运行 不 完 。 

如 果 你 花 点 时 间 在 计算 机 上 运行 绘制 一 个 大 概 需要 一 分 钟 左右 的 吾 树 ， 
你 只 需 通 过 观察 绘制 进度 ， 就 可 以 深入 了 解 递归 程序 的 性 质 ， 因 为 你 可 以 
看 到 每 个 互 字 母 的 出 现 过 程 以 及 形成 瓦 树 的 过 程 。 你 可 以 尝试 一 个 更 有 局 
发 性 的 练习 ， 可 以 改变 draw( 函数 和 StdDraw.line() 函数 的 调用 顺序 ,但 是 
不 管 改变 后 的 顺序 如 何 ， 得 到 的 图 像 总 是 一 样 的 ， 而 改变 的 只 是 线条 出 现 


E79 在 绘图 中 的 顺序 ( 见 练习 2.3.14 )。 


程序 2.3.4 ”递归 图 形 


public class Htree 
东 





pub1ic void draw(int n, double size, double x, double y) 
{ W 在 (Xy) 点 绘制 H 树 
// 递归 深度 为 n， 给 Rid 
if (ns=s= 0).ret 
double x0 = x - x1 = x + Size/2; 
double y0 = y - size/2, yl = y + size/2; 
StdDraw.line(x0, y, x1l, y); 
StdDraw.1line(x0, y0, x0, yl); 
StdDraw.1line(x1, y0, x1, y1); 


3 阶 





{x1, y1) 
draw(n-1, size/2, x0, y0); 
draw(n-1, size/2, x0, yl1); 
draw(n-1, size/2, x1, y0); Se 
draw(n-1, size/2, xl1, yl1); ! 
} 
(xl y0) 关 





public static void main(String[] args) 


int n = Integer.parseInt(args[0]); 
drawtns OS CS 0.5); 
} 
} 


函数 draw0 〇 以 (x，y) 为 中 心 ， 依照 字母 H 的 形状 ,绘制 三 条 线段 ， 每 条 线 
段 长 度 为 size。 然 后 ， 它 在 四 个 顶点 调用 自身 , 每 次 调用 中 size 减 半 。 整 个 函数 
通过 正 整 数 n 来 控制 递归 的 深度 。 


% java Htree 3 % java Htree 4 % java Htree 5 
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布朗 桥 ”五 树 是 分 形 (fractal) 的 一 个 简单 示例 : 分 形 图 形 是 一 个 几何 形状 ， 它 可 以 被 
分 为 几 个 部 分 ， 每 个 部 分 都 是 (或 近似 于 ) 原始 版 本 的 尺寸 缩小 版 。 科 学 家 、 数 学 家 和 程序 
员 从 许多 不 同 的 角度 来 研究 分 形 。 递 归程 序 很 容易 生成 分 形 图 形 。 本 书 有 几 个 分 形 的 例子 ， 
如 IFS ( 见 程 序 2.2.3 )。 

分 形 图 形 的 研究 在 艺术 表达 、 经 济 分 析 和 科学 发 现 中 起 着 重要 而 持久 的 作用 。 艺 术 家 
和 科学 家 使 用 分 形 来 构建 自然 界 中 出 现 的 复杂 形状 的 紧凑 模型 ， 并 取代 了 常规 的 几何 形状 模 
型 ， 如 云 、 植 物 、 山 脉 、 河 床 、 人 体 皮肤 等 使 用 的 模型 描述 都 是 分 形 图 形 。 经 济 学 家 则 使 用 
分 形 来 模拟 经 济 指标 的 函数 图 。 

分 形 布朗 运动 ( fractional Brownian motion) 是 一 个 数学 模型 ， 它 为 许多 自然 存在 的 四 
凸 不 平 的 形状 创建 逼真 的 分 形 模型 。 它 用 于 研究 金融 和 许多 自然 现象 ， 包 括 洋 流 和 神经 细胞 
膜 。 精 确 计算 分 形 模型 可 能 是 一 个 困难 的 挑战 ， 但 使 用 递归 程序 计算 近似 值 并 不 难 。 

Brownian (程序 2.3.5 ) 能 够 生成 一 个 函数 图 ， 它 是 


(Xm yntd) 
分 形 布朗 运动 的 近似 示例 ， 通 常 被 称 作 布朗 桥 (Brownian 2 
bridge)。 你 可 以 将 该 图 形 视 作 在 两 个 点 (wo, yo) 和 (Gs 0) na 一 





的 连 线 间 随 机 游 走 ， 并 由 几 个 参数 控制 。 程 序 的 实现 基于 中 
点 位 移 法 (midpoint displacement method)， 该 方法 是 在 x 的 
区 间 [xo，x] 内 递归 式 地 绘图 。 基 本 步骤 是 ， 当 两 个 端点 间 5 交 ) 
的 距离 小 于 给 定 的 最 小 值 时 ， 直 接 绘制 连接 两 个 端点 的 线 布朗 桥 计算 
段 。 归 约 步 又 是 将 间隔 分 为 两 半 ， 步 又 如 下 : 

。 计算 间隔 的 中 点 (x ym)。o 

。 向 坐标 的 中 点 加 添加 一 个 随机 值 5，5 满足 高 斯 分 布 ， 其 中 高 斯 分 布 的 均值 为 0， 

方差 由 程序 设 定 。 

。 在 子 区 间 上 递归 ， 将 方差 除 以 给 定 的 比例 系数 s。 

曲线 的 形状 由 两 个 参数 控制 : 波动 率 (volatility, 方差 的 初始 值 ) 控制 函数 曲线 偏离 原 
来 两 点 之 间 直 接 相 连 的 线段 的 距离 ，Hurst 指数 (Hurst exponent) 控制 曲线 的 平滑 度 。 我 们 
用 互 表 示 Hurst 指数 ， 并 在 每 次 递归 时 将 方差 除 以 2”。 当 五 是 12 (每 次 递归 减 半 ) 时 ， 曲 
线 是 一 个 布朗 桥 ， 即 赌 徒 破产 问题 的 连续 版 本 ( 见 程 序 1.3.8 )。 当 0<H<1/2 时 ， 偏 离 趋 于 增 
加 ， 使 得 程序 绘制 出 较 粗 糙 的 曲线 。 当 2>H>1/2 时 ， 偏 离 趋 于 减 小 ， 使 得 绘 出 的 曲线 更 平 
滑 。 值 2- 五 被 称 为 曲线 的 分 形 维度 (fractal dimension ) 。 

间隔 的 波动 率 和 初始 端点 与 缩放 和 位 置 有 关 。Brownian 中 的 测试 客户 程序 main() 允许 
我 们 改变 Hurst 指数 。 如 果 值 大 于 1/2， 你 绘制 的 图 像 会 像 山 地 景观 的 地 平 线 ; 如 果 值 小 于 
1/2， 你 会 得 到 与 股票 指数 相似 的 图 。 

将 中 点 位 移 法 扩展 到 二 维 ， 产生 的 分 形 图 像 被 称 为 等 离子 体 云 (plasma cloud)。 为 了 绘 
制 矩形 等 离子 体 云 ， 我 们 使 用 递归 ， 其 中 基础 步骤 是 绘制 给 定 颜色 的 矩形 ， 归 约 步骤 是 在 四 
个 象限 中 绘制 等 离子 体 云 ， 颜 色 受到 随机 高 斯 分 布 的 平均 值 的 影响 。 使 用 与 Brownian 相同 
的 波动 率 和 平滑 度 ， 我 们 可 以 生成 非常 逼真 的 合成 云 。 我 们 可 以 使 用 相同 的 代码 来 生成 合成 
地 形 ， 用 颜色 值 来 表示 不 同 海拔 。 这 种 方案 的 变种 广泛 应 用 于 娱乐 业 ， 特 别 是 用 于 为 电影 和 
游戏 创造 背景 风光 。 


GD 
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程序 2.3.5 布衣 烽 





public class Brownian 








{ 
public static void curve(double x0, double y0， x0, y0 
double x1, double y1， 和 
double var，double s) 
{ xm, ym 
了 CX X00. < O00.) Halea 
{ 
StdDraw.1line(x0, y0, x1, y1); Var 
return; hurst 
} 
double xm = (x0 + x1) / 2; 
double ym = (y0 + y1) / 2; 
double delta = StdRandom.gaussian(0, Math.sqrt(var)); 
Curve(x0, y0, xm, ym+delta, var/s, s); 
curve(xm, ym+delta, x1, yl, var/s, s); 
上 


public static void main(String[] args) 


double hurst = Double.parseDouble(args[0]); 
double s = Math.pow(2, 2*hurst); 
CUrveC0r O50 5D 3"0. 0 
了 
} 


所 
- 





左 端点 
右 端点 

中 点 

偏离 

图 六 
Hurst 指 数 


分 形 曲 线 ; 车 不 在 递归 程序 中 增加 随机 数 3 我 们 将 绘制 一 条 直线 。 称 为 Hurst 指 


数 的 命令 行 参数 hurst 控 制 曲线 的 平滑 度 。 


% java Brownian 1 % java Brownian 0.5 % java Brownian 0.05 





280 等 离子 体 云 


递归 的 陷阱 ”现在 ， 你 相信 递归 可 以 帮助 你 编写 紧凑 优雅 的 程序 。 当 你 开始 编写 自己 的 
递归 程序 时 ， 你 需要 注意 可 能 出 现 的 几 个 常见 错误 。 我 们 已 经 详细 讨论 了 其 中 的 一 个 〈 程 序 
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的 运行 时 间 可 能 呈 指 数 增长 )。 一 旦 发 现 这 些 问题 一 般 不 难 克服 ,但 在 编写 时 你 要 非常 小 
心地 避免 这 些 问题 。 
缺少 基础 步骤 。 思 考 以 下 递归 函数 ， 它 应 该 计算 谐 波 数 ， 但 是 缺少 了 基础 步骤 : 


public static double harmonic(int n) 


return harmonic(n-1) + 1.0/n; 


如 果 你 运行 调用 此 函数 的 客户 程序 ， 它 将 重复 调用 自身 ， 永 远 不 会 返回 ， 因 此 你 的 程 
序 将 永远 不 会 终止 。 你 可 能 已 经 碰 到 过 死 循 环 一 一 你 调用 了 你 的 程序 后 ， 但 什么 都 没有 发 生 
(或 者 程序 不 停 地 输出 )。 然 而 ， 随 着 无 限 递归 ， 结 果 会 不 一 样 ， 因 为 系统 会 跟踪 每 个 递归 调 
用 的 信息 (使 用 一 个 称 为 栈 的 数据 结构 ， 我 们 将 在 4.3 中 讨论 使 用 的 机 制 )， 最 终 会 用 尽 内 
存 。 最 终 ，Java 在 运行 时 报告 StackOverflowError。 当 你 编写 递归 程序 时 ， 你 需要 通过 基于 
数学 归纳 的 非 正式 论证 来 说 服 自 己 ， 以 确保 程序 能 够 达到 预期 的 效果 。 这 样 做 可 能 会 发 现 遗 
失 了 基础 步骤 。 

不 能 保证 收 仇 。 另 一 个 常见 的 问题 是 ,在 递归 函数 中 包含 一 个 递归 调用 来 解决 一 个 子 问 
题 ， 而 这 个 子 问题 的 规模 并 不 小 于 原始 问题 。 例 如 ， 对 于 参数 的 任何 值 (除了 1 )， 以 下 方法 
进入 无 限 弟 归 循 环 ， 因 为 参数 值 序列 不 会 收敛 到 基础 步 又 : 


public static double harmonic(int n) 





if (n == 1) return 1.0; 
return harmonic(n) + 1.0/n; 


} 


这 个 例子 中 的 错误 很 容易 发 现 ， 但 同样 是 这 类 问题 ， 如 果 参 数 中 有 细微 的 差别 ， 可 能 就 
不 那么 好 辨别 了 。 你 可 以 在 本 节 的 练习 中 找到 几 个 例子 。 

内 存 要 求 过 量 。 如 果 一 个 函数 在 返回 之 前 递归 调用 多 次 ， 则 Java 所 需 的 递归 调用 的 内 
存 可 能 无 法 满足 需求 ， 从 而 导致 报告 StackOverflowError。 要 想 知 道 涉及 了 多 少 内 存 ， 可 以 
运行 一 组 实验 : 使 用 递归 函数 来 计算 谐 波 数 ， 并 不 断 增加 的 值 。 


public static double harmonic(int n) 


if (n == 1) return 1.0; 
return harmonickn-1) + 1.0/n; 


} 


程序 报告 StackOverflowError 时 ， 你 对 Java 使 用 多 少 内 存 来 实现 递归 就 有 了 一 定 的 了 
解 。 相 比 之 下 ， 运 行程 序 1.3.5 计算 及， 当 n 很 大 时 ， 也 只 使 用 很 小 的 内 存 。 
重复 计算 过 量 。 一 个 函数 的 过 量 重复 计算 ,可 能 导致 函数 运行 时 间 呈 指数 级 增长 。 一 旦 
了 解 了 这 一 点 ， 在 编写 简单 的 递归 程序 以 解决 简单 问题 时 ， 就 会 更 加 谨慎 。 即 使 在 最 简单 的 
递归 函数 中 ， 这 种 情况 也 是 存在 的 ， 你 需要 尽量 避免 它 。 例 如 ， 斐 波 那 契 数 列 
0,1,1,2,3,5,8,13,21,34,55,89,144,233,377,… 
被 定义 为 ， 当 nn 三 2 时 ,循环 已 =P-i+P2， 并 且 Fo=0, Fl=1。 斐 波 那 契 序 列 具 有 许多 有 趣 的 
特性 ， 并 出 现在 很 多 应 用 中 。 一 个 新 手 程序 员 可 能 会 通过 如 下 递归 函数 来 计算 斐 波 那 契 数列 : 
// Warning: 这 个 函数 非常 低 效 


public static long fibonacci(int n) 
{ 


768 党 2 各 


if "(n== 0 Teturn 0; 
in == 1) return 1; 
return fibonacci(n-1) + fibonacci(n-2); 


} 


但 是 ， 这 个 函数 是 非常 没有 效率 的 ! 新 手 程序 员 通 
常 不 愿 相信 这 个 事实 ， 期 望 计 算 机 具有 足够 的 速度 可 以 运 
行 这 样 的 代码 以 解决 问题 。 下 面 我 们 用 这 个 函数 来 计算 
fibonacci(50)， 看 看 计算 机 是 否 具备 足够 的 速度 。 首 先 思考 
计算 fibonacei(8)=21 时 ， 函 数 需 要 先 计算 fibonacci(7)=13 和 
fibonacci(6)=8。 计 算 fibonacci(7) 时 ,递归 计算 fbonacci(6)=8 
和 fibonacci(5)=<5， 事 情 很 快 变 得 越 来 越 糟 ， 因 为 计算 
fibonacci(6)， 计 算 机 忽略 了 已 经 计算 过 fibonacci(5) 等 等 ， 以 
此 类 推 ， 这 个 程序 在 计算 fibonacci(n) 时 计算 fibonacci(1) 的 
次 数 正好 是 及 , ( 见 练习 2.3.12 )， 重 复 计 算 使 得 错误 呈 指 数 
级 增长 。 例 如 ， 计算 fibonacci(200)， 函 数 要 计算 Foo>10% 
次 fibonacci(1)。 很 难 想象 有 哪 台 计算 机 可 以 完成 这 么 多 的 
计算 。 注 意 那 些 需要 指数 级 运行 时 间 的 程序 。 许 多 计算 任 
务 直 接 想 到 的 最 简单 的 实现 方法 都 属于 这 一 类 ， 当 心 不 要 
陷入 试图 实施 和 运行 它们 的 陷阱 。 

接 下 来 ,我 们 会 学 习 一 种 避免 此 类 错误 的 系统 技术 ， 
称 为 动态 编程 (dynamic programming)。 动 态 编程 通过 保 
存 已 经 计算 过 的 值 以 供 后 续 使 用 ， 替 代 了 不 断 重复 的 计算 ， 
以 避免 重复 计算 的 过 量 。 

动态 编程 ”动态 编程 是 实现 递归 程序 常用 的 一 种 策略 ， 
它 为 众多 问题 提供 了 有 效 的 解决 方案 。 其 基本 思想 是 将 复 
杂 问 题 递 归 地 分 解 成 多 个 简单 的 子 问题 ， 存 储 每 个 子 问题 
的 答案 ， 并 最 终 使 用 存储 的 答案 来 解决 原始 问题 。 每 个 子 
问题 只 会 被 解决 一 次 (而 不 是 一 次 又 一 次 )， 这 种 技术 避免 
了 潜在 的 运行 时 间 指 数 级 爆炸 式 的 增长 。 

例如 ， 如 果 我 们 的 原始 问题 是 计算 第 n 个 斐 波 那 契 数 ， 
则 自然 地 划分 为 nt+l 个 子 问题 ， 其 中 子 问题 i 是 计算 第 i 个 


fibonacci (8) 
fibonacci (7) 
fibonacci(6) 
fibonacci(5) 
fibonacci(4) 
fibonacci(3) 
fibonacci(2) 
fibonacci (1) 
return 1 
fibonacci (0) 
return 0 
return 1 
fibonacci(1) 
return 1 
return 2 
fibonacci(2) 
fibonacci(1) 
return 1 
fibonacci(0) 
return 0 
return 1 
return 3 
fibonacci(3) 
fibonacci(2) 
fibonacci(1) 
return 1 
fibonacci (0) 
return 0 
return 1 
fibonacci(1) 
return 1 
return 2 
return 5 
fibonacci(4) 
fibonacci(3) 
fibonacci(2) 


计算 斐 波 那 契 数列 的 错误 方法 


斐 波 那 契 数 ， 其 中 0 冬运 2。 如 果 我 们 已 经 知道 了 较 小 子 问题 的 解决 方案 ， 我 们 就 可 以 轻松 
地 解决 子 问题 ， 在 这 个 例子 中 ， 如 果 解 决 了 子 问 题 i-1 和 i-2， 那 就 很 容易 解决 第 i 个 子 问 


题 。 此 外 ， 求 解 原始 问题 也 变 成 了 解决 其 中 一 个 子 问题 





第 nn 个 子 问题 。 


自 上 而 下 的 动态 规划 。 在 自 上 而 下 的 动态 编程 中 ， 我 们 存储 或 缓存 我 们 解决 的 每 个 子 问 
题 的 结果 ,以 便 下 次 我 们 需要 解决 相同 的 子 问 题 时 ， 我 们 可 以 使 用 缓存 的 值 ， 而 不 是 从 头 开 
始 解决 子 问题 。 对 于 斐 波 那 契 数列 的 例子 ， 我 们 使 用 数组 ff] 存储 已 经 计算 过 的 斐 波 那 契 数 。 
在 Java 中 ， 我 们 通过 使 用 在 任何 方法 之 外 声明 的 静态 变量 (也 称 为 类 变量 或 全 局 变量 ) 来 实 


现 此 操作 。 这 允许 我 们 将 信息 从 一 个 函数 调用 保存 到 下 一 个 。 
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public class TopDownFibonacci 缓存 的 值 


{ 
private static long[] nora 


public static long fibonacci(int n). 


静态 变量 (在 { 返回 缓存 值 








所 有 方法 之 外 声明 ) ”if (Cn == 0) return 0; ( 如 果 已 经 计算 过 ) 
if_(n,.== 1) return 1; 2 
0 
nj = T1ponacc1 (nN- + T1pbonaccT An- 
return f[n]; 
的 计算 当前 值 并 保存 


用 于 计算 斐 波 那 契 数 的 自 上 而 下 的 动态 编程 方法 


自 上 而 下 的 动态 编程 也 被 称 为 记忆 (memorization)， 因 为 它 通 过 记 住 函数 调用 的 结果 避 
免 了 重复 的 工作 。 

自 底 向 上 的 动态 编程 。 在 自 底 向 上 的 动态 编程 中 ,我 们 从 “最 简单 ”的 子 问题 开始 ， 对 
所 有 子 问题 进行 计算 ,逐渐 建立 起 对 越 来 越 复杂 的 子 问 题 的 解决 方案 。 为 了 完成 自 底 向 上 的 动 
态 编程 ， 我 们 必须 对 子 问 题 进 行 排 序 ， 以 便 每 个 后 续 的 子 问 题 可 以 通过 先前 已 经 解决 的 子 问题 
相互 组 合 来 解决 。 对 于 韭 波 那 契 数列 的 例子 ， 这 很 容易 : 按照 0、1、2 等 的 顺序 解决 子 问题 。 
当 我 们 需要 解决 子 问题 i 时 ,我们 已 经 解决 了 所 有 更 小 的 子 问 题 ， 也 就 是 子 问题 i-1 和 i-2。 


public static long fibonacci(int n) 


int[] f = new int[n+1]; 
f[0 拒 = ,0; 
f[1] =- 和; 
for (intsi =2; 1 «=n; 计 +) 
f[i] = f[i-1] + f[i-2]; 
return f[n]; 
} 
当 子 问题 的 排序 是 明确 的 ， 同 时 空间 可 用 于 存储 所 有 的 解决 方案 时 ， 自 底 向 上 的 动态 编 
程 是 一 个 非常 有 效 的 方法 。 . 
接 下 来 ， 我 们 学 习 动 态 编程 更 复杂 的 应 用 ， 其 中 解决 子 问题 的 顺序 不 是 那么 明确 。 与 计 
算 斐 波 那 契 数字 的 问题 不 同 ， 这 个 问题 若 没 有 递归 式 思 考 ; 以 及 自 底 向 上 的 动态 编程 方式 ， 
将 很 难得 到 解决 。 
最 长 公共 子 序列 问题 。 下 面 我 们 来 讨论 一 个 字符 串 处 理 的 基础 问题 ， 它 也 常 应 用 于 生 
物 学 或 其 他 领域 。 假 设 有 两 个 给 定 的 字符 串 x 和 yy， 我 们 想 比较 它们 的 相似 度 。 常 见 的 类 似 
问题 包括 比较 两 个 DNA 序列 的 同 源 性 、 两 个 英文 单词 拼写 的 相似 性 或 两 个 Java 代码 文件 的 
重复 度 等 。 相 似 度 的 度量 方法 是 计算 最 长 公共 子 序列 (Longest Common Subsequence, LCS) 
的 长 度 。 如 果 我 们 从 x 中 删除 一 些 字符 ,并 从 yy 中 删除 一 些 字符 ， 使 得 生成 的 两 个 字符 串 相 
等 ， 则 我 们 将 生成 的 字符 串 称 为 公共 子 序列 (common subsequence)。LCS 问题 是 找到 两 个 
字符 串 的 尽 可 能 长 的 公共 子 序列 。 例 如 ，GGCACCACG 和 ACGGCGGATACG 的 LCS 是 字 
符 串 GGCAACG， 它 的 长 度 为 7。 
计算 LCS 的 算法 很 多 用 于 数据 比较 程序 ， 如 UNIX 中 的 dif 命令 ,已 经 被 使 用 了 几 十 
年 ， 程 序 员 可 以 通过 这 个 命令 找到 文本 文件 中 的 差异 和 相似 之 处 。 类 似 的 算法 在 科学 应 用 中 
扮演 重要 角色 ， 如 计算 生物 学 中 的 史密斯 - 沃 特 曼 算法 (Smith-Waterman algorithm) 和 数字 
通信 理论 中 的 维特 比 算法 (Viterbi algorithm ) 。 
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LCS 的 递 推 。 现 在 我 们 描述 一 个 递归 公式 ， 帮 助 我 们 找到 两 个 给 定 的 字符 串 s 和 上 的 
LSC。 令 贡 和 nn 分 别 为 s 和 + 的 长 度 ， 我 们 使 用 符号 s[i..m) 表示 从 索引 i 开始 的 s 的 后 半 部 
分 ， 称 为 s 的 后 级 ，i[..n) 表示 从 索引 j 开 始 的 1 的 后 级 。 一 种 情况 下 ， 如 果 s 和 + 上 以 相同 的 
字符 开始 ， 则 s 和 +9 的 LCS 就 包含 第 一 个 字符 。 因 此 ,我 们 的 问题 可 以 化 简 为 找到 后 绥 
s[1..m) 和 t[1..n) 的 LCS。 另 一 种 情况 下 ， 如 果 s 和 + 以 不 同 的 字符 开始 ， 则 两 个 字符 串 的 首 
字符 都 不 能 成 为 公共 子 序 列 的 一 部 分 ， 所 以 我 们 可 以 放心 地 放弃 其 中 一 个 字符 。 在 这 种 情况 
下 ， 问 题 都 会 化 简 为 找到 s[0..m) 和 tf1..n) 的 LCS 或 s[1..m) 和 tf0..n] 的 LCS， 并 取 其 中 较 
大 的 一 个 9 (原来 的 问题 变 成 了 两 个 子 问题 ,但 是 两 个 子 问题 的 规模 都 在 严格 缩小 一 一 译 者 
注 )。 不 失 一 般 性 地 ， 我 们 让 opt[][] 表示 后 缀 s[i..m) 和 tj..n 9 ) 的 LCS 的 长 度 ， 则 以 下 递 
推 表达 式 表达 了 opt 思 [的 计算 规则 : 





0 ，7= 几 或 j=n 
opt[i][] -| wetra J+1] + 1 ”5S[i] = t[ 力 
max(Copt[i7，Jj+1]，opt[i+1, j]) 其 他 


动态 编程 解决 方案 。LongestCommonSubsequence (程序 2.3.6 ) 采用 自 底 向 上 的 动态 编 
程 方 法 解决 这 一 递 推 问题 。 我 们 维护 二 维 数组 opt[ 四 中， 存储 后 缀 s[i..m) 和 tj..n) 的 LCS 的 
长 度 。 最 初 ， 底 行 (i=m) 和 右 列 (j=n) 为 0， 这 些 是 初始 值 。 从 递 推 计算 公式 的 定义 ,我 
们 可 以 清楚 地 看 出 后 续 计算 的 顺序 . 我 们 从 opt[m][n]=1 开始 ， 然 后 只 要 逐一 减少 ?或 7 或 两 
者 同时 减少 ， 就 可 以 逐步 计算 出 需要 计算 的 opt[i][ 站 。 每 当 计 算 opt[i] 中 时 ， 它 所 需要 的 是 
下 标 大 于 i 或 j 或 同时 大 于 两 者 的 opt[][] 中 的 元 素 ， 而 那些 元 素 已 经 计算 出 来 了 。 程 序 2.3.6 
中 的 方法 lcs( 通过 按 行 从 下 到 上 (i 从 m=-1 到 0)， 每 行 从 右 到 左 (7 从 wm-1 至 0) 的 顺序 填 
充 opt[][] 中 的 元 素 。 另 外 一 种 替代 方案 是 按 列 从 右 到 左 ， 并 每 列 从 下 到 上 的 顺序 进行 逐个 
求 值 并 填充 。 在 下 图 中 ， 每 个 元 素 都 有 一 个 或 两 个 指向 它 的 蓝 色 箭头 ， 用 于 表示 计算 它 时 所 
用 到 的 值 ( 当 按照 公式 中 求 最 大 值 进 行 计算 时 ， 就 会 显示 两 个 箭头 )。 


人 
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字符 串 GGCACCACG 和 ACGGCGGATACG 的 最 长 公共 子 序列 


日 ”这 个 地 方 原 书 是 x*、y， 应 该 是 错 了 。 一 一 译 者 注 
日 。 原 书 有 误 。 一 一 译 者 注 
稀 ” 这 里 原 书 是 m， 应 该 是 写 错 了 。 一 一 译 者 注 
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程序 2.3.6 ”最 长 公共 于 序列 


public class LongestCommonSubsequence 








public static String lcs(String s, String t) 
{ 人 
int m = s.lengthO), n = t.length(); 
int[][} opt = new EM 
for (int i = m-1; 1 >= 0; 1--) 
for Gintt Ym:hsLnd .= OA) 
if (s.charAt(i) == t.charAt(j)) 
opt[i][j] = opt[i+1][j+1] + 1; 


else 
opt[i][j] = Math.max(opt[i+1][j], opt[i][j+1]); 


// 返回 最 长 公共 子 序 列 本 身 
String 1cs = ""; 


int i = 0, j = 0; s，t 两 个 字符 串 
whileCi <'m && j < n) mn | 两 个 字符 囊 的 长 度 
放生 下 局 着 的 时 ,< 辣 语 全 及 五 痪 本 革 层 蒜 国 我 效 贡 的 
{ LCS 的 长 度 
1cs += s.charAt(i); 1cs 最 长 公共 子 序列 
i+t+; i 
下 


于 
else if (opt[i+1][j] >= opt[i][j+1]) it+t; 
else 


} 
return lcs; 


public static void main(String[] args) 
{ StdOut.printin(lcs(args[0], args[1])); } 


函数 lcs0 使 用 自 底 向 上 的 动态 编程 方法 ， 计 算 并 返回 两 个 字符 串 x 和 y 的 
LCS。 方 法 调用 s.charAt(i) 返 回 字 符 串 s 的 字符 i。 


% java LongestCommonSubsequence GGCACCACG ACGGCGGATACG 
GGCAACG 


最 后 的 问题 是 如 何 返 回 最 长 公共 子 序列 本 身 ， 而 不 仅仅 只 返回 它 的 长 度 。 解 决 问题 的 
关键 在 于 回 滴 (backward) 动态 编程 算法 的 步 又， 重新 发 现 opt[0][0] 到 opt[m][n] 的 选择 
路 径 (上 图 中 以 次 色 突 出 显示 )。 为 了 找 出 我 们 如 何 确 定 optD]D] 的 选择 ， 需 要 考虑 三 种 可 
能 性 : 

。 字符 s[] 等 于 t 轨 。 在 这 种 情况 下， 我 们 一 定 可 以 得 出 opt[i][]=opt[i+1]D+1]+1, LCS 

中 的 下 一 个 字符 是 s[ (或 1 轨 )， 所 以 我 们 在 LCS 中 包括 字符 sf (或 (四)， 并 继续 
从 opt[i+1][i+1] 追溯 。 

。LCS 不 包含 s[i]。 在 这 种 情况 下 ，opt[ 站 [=opt[i+1] 中 ]， 我 们 继续 追溯 opt[i+1] 四 。 

。LCS 不 包含 t[ 胃 。 在 这 种 情况 下，opt[ 引 [让 =opt[ 如 [+1]， 我 们 继续 从 opt[i][j+1] 追溯 。 

我 们 从 opt[0][0] 开始 追踪 并 一 直 和 迭代 直到 opt[m][n]。 在 追溯 的 每 个 步骤 中 ,i 增加 1 或 
者 j 增 加 1 (或 两 者 同时 增加 1 )， 我 们 可 以 用 一 个 while 循环 实现 该 过 程 ， 这 个 循环 将 在 最 
多 m+tn 次 迭代 之 后 终止 。 

动态 编程 是 基本 算法 的 一 种 设计 范式 ， 与 递归 密切 相关 。 如 果 你 稍 后 继续 学 习 算 法 或 运 
算 研 究 课程 ， 那 么 你 一 定 会 学 到 更 多 相关 的 知识 。 递 归 是 计算 的 基础 ， 避 免 重复 计算 当然 也 
是 计算 的 一 个 基础 。 并 不 是 所 有 的 问题 都 可 以 直接 转换 为 递归 公式 ， 也 不 是 所 有 的 递归 公式 
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都 包含 一 种 可 以 避免 重复 计算 的 计算 顺序 一 一 有 时 候 你 会 一 下 子 同时 解决 两 个 问题 ， 既 找到 
递归 公式 又 给 出 避免 重复 计算 的 方法 ， 正 如 你 刚刚 看 到 的 LCS 问题 一 样 ， 第 一 次 碰 到 这 样 
的 情况 时 或 许 会 让 你 觉得 不 可 思议 。 

总 结 不 使 用 递归 的 程序 员 会 失去 两 个 优势 : 首先 ， 递归 可 以 实现 复杂 问题 的 紧凑 解决 
方案 ; 其 次 ,递归 解决 方案 可 以 保证 程序 按照 计划 预期 运行 。 在 早期 的 计算 中 ,递归 程序 因 
相关 的 开销 过 高 而 在 一 些 系统 中 禁止 使 用 ， 因 此 许多 程序 员 会 尽量 避免 使 用 递归 。 但 是 ,在 
像 Java 这 样 的 现代 系统 中 ， 使 用 递归 通常 会 是 一 个 明智 的 选择 。 

递归 函数 真正 展现 了 精心 阐述 抽象 概念 的 力量 。 虽 然 一 个 函数 能 够 调用 自身 这 一 概念 起 
初 对 许多 人 来 说 似乎 是 荒唐 的 ， 但 我 们 讨论 的 许多 例子 强 有 力 地 说 明 ， 掌 握 递归 对 于 理解 和 
利用 计算 以 及 理解 计算 模型 在 研究 中 的 作用 至 关 重 要 。 

递归 给 我 们 强化 了 一 个 理念 ， 在 编程 时 需要 证 明 一 个 程序 可 以 按照 预期 运行 。 递 归 与 数 
学 归纳 之 间 的 自然 联系 至 关 重要 。 对 于 日 常 编程 ， 我 们 对 程序 正确 性 的 关注 主要 集中 于 如 何 
节省 用 于 跟踪 错误 的 时 间 和 精力 。 在 现代 应 用 中 ， 安 全 和 隐私 问题 使 正确 性 成 为 编程 至 关 重 
要 的 组 成 部 分 。 如 果 程 序 员 不 能 确定 应 用 程序 是 否 按 预期 方式 工作 ， 那么 如 何 保 障 个 人 数据 
的 私密 性 和 安全 性 呢 ? 

自从 20 世纪 后 半 叶 以 来 ,计算 机 在 日 常生 活 中 逐渐 发 挥 核 心 作用 ， 而 在 开发 这 些 宏大 
的 计算 基础 设施 的 过 程 中 ， 递 归 就 是 程序 设计 模块 中 最 后 关键 一 环 。 程序 由 库 和 函数 构成 ， 
而 函数 由 各 类 语句 组 成 包括 基本 类 型 数据 、 条 件 、 循 环 和 函数 调用 (包括 递归 操作 ) 执行 
语句 等 。 这 些 方法 和 工具 可 以 解决 各 种 重要 的 问题 。 在 下 一 节 中 ， 我 们 将 强调 这 一 点 ， 并 在 
一 个 大 型 应 用 程序 的 上 下 文中 回顾 这 些 概念 。 在 第 3 章 和 第 4 章 中 ， 我 们 将 扩展 这 些 概念 ， 
让 你 领略 更 广泛 的 编程 模式 ， 从 而 深入 理解 现代 计算 机 世界 。 
问答 环节 

问 : 是 否 存在 只 能 通过 迭代 来 解决 的 问题 ? 

答 : 不 ， 所 有 循环 都 可 以 由 递归 函数 替代 ， 尽 管 递归 版 本 可 能 需要 过 多 的 内 存 。 

问 : 是 否 存在 只 能 通过 递归 来 解决 的 问题 ? 

答 : 不 ， 所 有 递归 函数 都 可 以 被 对 应 的 迭代 所 代 蔡 。 在 4.3 节 中 ,我们 将 看 到 编译 器 如 
果 使 用 一 种 被 称 为 栈 的 数据 结构 来 生成 函数 调用 过 程 的 代码 。 

问 : 对 于 递归 和 迭代 ， 我 应 该 选择 哪 种? 

答 : 哪 一 种 能 让 你 写 出 更 简单 、 更 容易 理解 或 更 高 效 的 代码 ， 就 选择 哪 一 种 。 

问 : 关于 递归 代码 ,我 已 经 注意 到 了 它 会 消耗 更 多 的 空间 ， 还 有 重复 计算 的 问题 ,还 有 
其 他 需要 关注 的 吗 ? 

答 : 在 递归 代码 中 创建 数组 需要 格外 谨慎 。 使 用 的 空间 量 可 能 会 急剧 增加 ， 同 时 内 存 管 
理 所 需 的 时 间 也 会 急剧 增加 。 


练习 

2.3.1 ”如 果 你 使 用 负 值 n 调用 factorial(), 会 发 生 什么 ? 或 者 n 较 大 时 ,例如 35， 会 发 生 什么 ? 
2.3.2 编写 一 个 递归 函数 ， 它 以 整数 为 参数 ， 返 回 ln(n!)。 

2.3.3 ”调用 ex233(6) 后 ,打印 出 的 整数 序列 是 什么 ? 


2.3:4 


2.3.6 
色光 


2.3.9 
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public static void ex233(int n) 
{ 
if (n <= 0) return; 
StdOut.printin(n); 
ex233(n-2); 
ex233(n-3); 
Stdout.println(Cn) ; 
} 


给 出 调用 ex234(6) 的 结果 值 : 
public static String ex234(int n) 


if (Cn <= 0) return ""; 
return ex234(n-3) + Nn + ex234(n-2) + n; 
} 


指出 以 下 递归 函数 的 错误 : 


public static String ex235(Cint n) 

{ 
String s = ex235(n-3) + n + ex235(n-2) + n; 
if An x= 0 Feturns 
return s; 


} 


参考 答案 : 因为 基础 步骤 出 现在 归纳 步 又 之 后 ， 所 以 该 函数 不 会 收敛 。 调 用 ex235(3) 将 导 
致 调用 ex235(0)、ex235(-3)、ex235(-6) 等 ， 以 此 类 推 ， 直 到 报告 错误 : StackOverflowError。 291 
给 了 4 个 正 数 a、b、c 和 d， 试 着 计算 gcd(gcd(aib)、gcd(c,d))。 
假设 p 是 整数 和 q 是 除数 ,解释 下 列 欧 几 里 得 函数 的 作用 : 
public static boolean gcdlike(int p, int q) 
, if. (q = 0) return (p == 1); 


return gcdlike(q, p % q); 


思考 以 下 递归 函数 : 
public static int mystery(int a, int b) 


1f° Cb" =="0) return 0; 
if (b % 2 == 0) return mystery(a+a, b/2); 
return mystery(at+a, b/2) + a; 


} 

mystery(2,25) 和 mystery(3,11) 的 结果 值 是 什么 ”给 定 正 整 数 a 和 b， 计算 mystery(a，b) 的 
结果 值 。 用 “* ”替换 “+”， 用 返回 1 代 蔡 返回 0， 再 次 回答 相同 的 问题 。 
编写 递归 程序 Ruler， 用 StdDraw 绘制 标尺 中 更 细小 的 刻度 ， 如 程序 1.2.1 所 示 。 


2.3.10 ”假设 7(1)=1, ”是 2 的 整数 寡 ， 编 写 程序 实现 如 下 递归 关系 。 


| 


e T(n)=T(n/2)+1 
e T(n)=27T(n/2)+1 
e T(n)=27(n/2)+n 
e 7T(n)=47(n/2)+3 
通过 归纳 法 证 明 ， 递 归 方法 得 到 的 解法 是 解决 汉 诺 塔 问题 的 最 小 移动 次 数 的 解决 方案 。 292 


2.3.12 通过 归纳 法 证 明 ， 当 使 用 书 中 给 出 的 递归 程序 计算 fibonacci(n) 时 ， 对 fibonacci(1) 的 递归 调 


用 次 数 为 F,。 


293 


294 


174 


235 和 3 


2.3.14 


舅 2 并 


证 明 递 归 调 用 gcd0 时 ， 第 二 个 参数 每 次 调用 时 递减 的 速率 至 少 为 2 的 倍数 。 然 后 证 明 : 
gcd(p,9) 最 多 使 用 21ogzn+1 次 递归 调用 ,其 中 是 p 和 g 中 的 较 大 值 。 

修改 Htree 程序 (程序 2.3.4 ) 为 互 树 的 图 形 设置 动 画 。 然 后 ， 重 新 排列 递归 调用 (以 及 基础 步 
又 ) 的 顺序 ， 查 看 生成 的 动画 ， 并 解释 你 得 到 的 每 个 结果 。 


20% 40% 


100% 





创新 练习 


2.3.15 


2.3a16 


本 


23.18 


19 


2.3,20 


二 进 制 表 示 。 写 一 个 程序 ， 以 一 个 正 整 数 n (十 进 制 ) 作为 命令 行 参数 ， 打 印 出 该 正 整数 的 二 
进 制 表示 形式 。 回 顾 在 程序 1.3.7 中 我 们 使 用 了 减 去 2 的 寡 方 的 方法 。 现 在 ， 我 们 使 用 下 面 更 
简单 的 方法 : 重复 地 将 n 除 以 2 并 反 向 输出 每 次 计算 获得 的 余数 。 首 先 写 一 个 while 循环 来 完 
成 这 样 的 计算 ， 并 且 按 顺序 打印 出 每 次 计算 获得 的 余数 (此 时 的 顺序 是 错误 的 )， 然 后 将 顺序 
翻转 ， 打 印 出 余数 正确 的 顺序 。 

A4 纸 。 在 ISO 标准 下 纸 的 宽 高 比 是 2 :1。A0 纸 的 面积 是 1 平方 米 ， Al 纸 是 将 A0 纸 沿 垂直 
方向 一 分 为 二 ; A2 纸 是 Al 纸 沿 水 平方 向 一 分 为 三 ; 以 此 类 推 。 写 一 个 程序 使 得 以 一 个 整数 n 
作为 命令 行 参数 并 使 用 StdDraw 来 展示 如 何 将 一 张 A0 纸 切 成 2" 张 。 

排列 。 写 一 个 程序 Permutations， 以 一 个 整数 n 作为 命令 行 参数 并 打印 出 所 有 的 nn 个 字母 (从 
字母 a 开始 ) 的 nl! 种 排列 (假设 n 不 大 于 26 )。n 个 元 素 的 一 个 排列 是 这 些 元 素 n! 种 可 能 的 
排列 顺序 之 一 。 举 个 例子 ， 当 n=3 时 ， 你 应 该 获得 下 面 的 输出 (不 用 考虑 枚 举 所 有 排列 时 输出 
的 顺序 ): 


bca cba cab acb bac abc 


元 素 个 数 为 k 的 排列 。 修 改 上 个 例子 中 Permutations 程序 使 得 它 可 以 以 两 个 参数 n 和 作为 命 
令 行 参数 ， 并 打印 出 所 有 刚好 包含 这 个 元 素 中 个 元 素 的 P(n, 忆 =n1/(n- 甩 ! 种 排列 。 下 面 是 
当 本 2,n=4 时 的 预期 输出 (同样 不 用 考虑 输出 的 顺序 ): 

ab ac ad ba bc bd ca cb cd da db dc 


组 合 。 写 一 个 程序 Combinations， 它 以 一 个 整数 作为 命令 行 参 数 并 打印 出 所 有 的 2 个 任意 
长 度 的 组 合 。 一 个 组 合 是 个 元 素 的 一 个 子 集 ,， 不 要 考虑 顺序 。 举 个 例子 ， 当 n=3 时 ， 你 应 
该 得 到 下 面 的 输出 : 

aab abc acb bc c 

注意 你 的 程序 需要 打印 出 一 个 空 字符 串 (长 度 为 0 的 子 集 )。 

元 素 个 数 为 k 的 组 合 。 修 改 上 个 例子 中 的 Combinations 程序 使 得 它 以 两 个 整数 n 和 作为 命 
令 行 参数 ， 并 打印 出 所 有 的 CCz 昌 =zU(kLCz- 有 ID) 个 长 度 为 上 的 组 合 。 举 个 例子 ， 当 =5、 大 3 
时 ， 你 应 该 得 到 下 面 的 输出 : 


abc abd abe acd ace ade bcd bce bde cde 


.3:21 


2:822 


S23 


2.3.24 


2Z325 


2.3:26 


2.327 


2.3.28 


2.3.29 
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汉 明 距离 。 两 个 长 度 为 n 的 二 进 制 字符 串 之 间 的 汉 明 距离 等 于 这 两 个 字符 串 位 不 同 的 个 数 。 
写 一 个 程序 从 命令 行 读 人 一 个 整数 上 和 一 个 二 进 制 字符 串 s 并 打印 出 所 有 和 字符 串 s 汉 明 距离 
不 超过 上 的 三 进 制 字符 串 。 举 个 例子 ， 如 果 后 2、s 是 0000,， 那么 你 的 程序 需要 打印 出 

0011 0101 0110 1001 1010 1100 

提示 : 选择 s 中 上 位 进行 翻转 。 

递归 正方 形 。 写 一 个 程序 来 生成 下 面 的 递归 图 案 。 这 些 正 方形 的 大 小 之 比 为 2.2:1, -要 画 一 个 
有 阴影 的 正方 形 ， 可 以 先 画 一 个 有 填充 的 灰色 正方 形 ， 再 画 一 个 未 填充 的 黑色 边框 的 正方 形 。 


翻 前 饼 。 在 锅 里 有 一 操 大 小 不 同 的 n 个 前 饼 。 你 的 目标 是 重新 排列 这 一 操 前 饼 使 得 最 大 的 前 
饼 在 最 下 面 ， 最 小 的 前 饼 在 最 上 面 。 你 仅仅 可 以 翻转 最 上 面 的 个 煎饼 ， 从 而 反 转 它们 的 顺 
序 。 设 计 一 个 递归 策略 使 得 通过 最 多 2n-3 次 翻转 就 能 正确 排列 这 些 煎饼 。 

格雷 码 。 修 改 Beckett (程序 2.3.3 ) 来 打印 格雷 码 (不 仅仅 是 那些 改变 了 的 位 的 序列 ) 

汉 诺 塔 变 体 。 思 考 下 面 的 汉 诺 塔 问题 的 变 体 。 三 个 柱子 上 共有 27 个 尺寸 递增 的 圆 盘 。 初 始 状 
态 所 有 奇数 尺寸 ( 1, 3, …, 2n-1 ) 的 圆 盘 放 在 左边 的 柱子 上 ， 从 上 到 下 按 尺寸 递增 的 顺序 依次 
排列 ; 所 有 偶数 尺寸 (2,4, …, 2n) 的 圆 盘 按 尺寸 递增 的 顺序 从 上 到 下 依 
次 排列 在 右边 的 柱子 上 ; 写 一 个 程序 ， 使 右边 柱子 上 的 圆 盘 移 到 左边 柱 
子 并 把 左边 柱子 上 的 圆 盘 移 到 右边 。 注 意 还 需要 遵守 汉 诺 塔 问题 的 规则 。 
动画 版 汉 诺 塔 。 使 用 StdDraw 来 把 汉 诺 塔 问 题 的 解决 过 程 用 动画 展示 出 
来 ， 大概 一 秒 移动 一 个 圆 盘 。 

谢 尔 宾 斯 基 三 角形 。 写 一 个 递归 程序 来 绘制 谢 尔 宾 斯 基 三 角形 ( 见 程序 
2.2.3 )。 像 Htree 一 样 使 用 命令 行 参 数 来 控制 递归 深度 。 

二 项 分 布 。 估 计 下 面 用 来 计算 binomial ( 100, 50 ) 的 代码 递归 调用 的 
次 数 : 3 阶 


public static double binomial(int n, int k) 
t 
if-((n == 0) && (k == 0)) return 1.0; 
"FF Cn AO VG < 0 return TO 
return (binomial(n-1, k) + binomial(n-1, k-1))/2.0; 





1 阶 


谢 尔 宾 斯 基 三 角形 


基于 动态 规划 给 出 一 个 更 好 的 解决 方法 。 提 示 : 见 练习 1.4.41。 
Collatz 函数 。 思 考 下 面 的 递归 函数 。 这 个 问题 和 数论 中 一 个 尚未 解决 的 著名 问题 有 关 ， 这 个 
问题 被 称 为 Collatz 问题 或 32+1 问题 。 


public static void collatz(int n) 
{ 
StdOut.print(n + " "); 
i1fE(N ==71) retorhs 
if (Cn % 2 == 0) collatz(n ./ 2); 
else collatz(3*n + 1); 


} 
举 个 例子 ， 一 个 对 collatz(7) 的 调用 会 产生 17 次 递归 调用 并 打印 如 下 序列 : 


297 


298 
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2.3.30 


2.331 
2.3.32 


2.3.33 


2.3.34 


2.4 


第 2 蓝 


7 22 11 34 17 52 26 13 40 20 105168421 


写 一 个 程序 ， 以 一 个 整数 作为 命令 行 参数 ， 返 回 一 个 整数 i(i<n)， 在 将 所 有 小 于 的 整 
数 作为 collatz 函数 的 参数 调用 时 ，collatz(i) 能 够 产生 最 大 的 递归 调用 次 数 。 这 个 问题 之 所 以 
未 解决 是 因为 没有 人 知道 这 个 函数 对 任何 整数 是 否 都 能 在 有 限 次 内 调用 结束 (数学 归纳 法 无 法 
解决 这 个 问题 因为 总 有 一 个 递归 调用 会 调用 到 更 大 的 值 )。 
布朗 岛 。B.Mandelbrot 曾经 提出 过 一 个 很 著名 的 问题 : 英国 的 海岸 线 有 多 长 ? 修改 程序 
Brownian 来 获得 一 个 新 的 可 以 画 出 布朗 岛 的 程序 BrownianIsland (这 个 岛 的 海岸 线 看 起 来 和 大 
不 列 颠 岛 的 海岸 线 很 像 ) 。 这 个 修改 很 简单 : 第 一 ， 修 改 curve() 函数 ， 在 x 坐 标 和 ? 坐标 均 添 
加 随机 高 斯 分 布 变量 ; 第 二 ， 修 改 main() 函数 来 从 画布 的 中 央 开 始 画 一 条 闭合 的 曲线 。 尝 试 
在 你 的 程序 中 使 用 不 同 的 参数 来 画 出 看 起 来 很 逼真 的 岛屿 。 


Hurst 指数 是 0.76 的 布朗 岛 图 


等 离子 体 云 。 写 一 个 可 以 画 出 等 离子 体 云 的 递归 程序 ， 可 以 使 用 文中 提 到 的 方法 。 
一 个 奇怪 的 函数 。 思 考 如 下 麦肯锡 (McCarthy) 91 函数 : 





public static int mcCarthy(int n) 
{ 
if n > 100) return n = 10; 
return mcCarthy(mcCarthy (n+11)); 
} 


请 不 要 使 用 计算 机 直接 给 出 meCarthy(50) 的 结果 值 。 给 出 为 了 获得 这 个 结果 对 mcCarthy() 
函数 的 调用 次 数 。 证 明 对 所 有 正 整 数 n 都 会 收敛 到 基础 步骤 ,或 者 给 出 n 的 值 ， 使 得 递归 进入 
无 限 循环 。 
递归 树 。 写 一 个 程序 Tree 使 得 它 可 以 以 一 个 整数 n 作为 命令 行 参数 ,并 且 在 nn 等 于 1、2、3、 
4 和 8 时 分 别 绘制 出 以 下 图 形 : 


1 必 汉 4 8 


We 


最 长 回 文 子 序列 。 写 一 个 程序 LongestPalindromicSubsequence ， 它 以 一 个 字符 串 作 为 命令 行 
参数 ， 并 获得 这 个 字符 串 的 最 长 回 文子 序列 ( 回 文 是 指正 着 读 和 倒 着 读 相同 )。 提 示 : 计算 这 
个 字符 串 及 其 反 转 后 的 字符 串 的 最 长 公共 子 序列 。 


案例 研究 : 渗透 





到 目前 为 止 ， 我 们 已 经 学 过 的 编程 工具 足以 让 我 们 解决 所 有 重要 问题 。 本 节 我 们 将 研究 
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并 开发 一 个 复杂 程序 来 解决 一 个 有 趣 的 科学 问题 ， 并 以 此 为 案例 来 总 结 我 们 对 方法 和 模块 的 
学 习 。 我 们 这 样 做 的 目的 是 结合 具体 问题 ， 在 解决 各 种 挑战 和 困难 的 过 程 中 ， 回 顾 我 们 所 涵 
盖 的 基本 要 素 ， 并 展示 一 种 可 以 广泛 应 用 的 编程 风格 。 

在 这 个 案例 中 ， 我 们 采用 一 种 广泛 适用 的 计算 技术 ， 称 为 蒙特 卡 罗 模 拟 (Monte Carlo 
simulation)， 以 研究 一 种 称 为 渗透 (percolation) 的 自然 模型 。“ 蒙 特 卡 罗 模 拟 ” 这 一 术语 是 指 通 
过 随机 执行 多 次 试验 来 评估 未 知 量 的 计算 技术 ， 也 被 称 为 模拟 (simulation)。 前 文中 我 们 已 经 多 
次 讨论 并 使 用 过 这 一 技术 ， 如 赌 徒 破产 问题 和 卡 券 收集 问题 。 这 一 方法 的 核心 理念 不 是 建立 一 
个 完整 的 数学 模型 或 者 测量 一 个 实验 的 所 有 可 能 的 结果 ， 而 是 依靠 概率 法 则 体现 模型 的 规律 。 

在 本 节 的 案例 研究 中 ,我 们 将 学 习 一 部 分 渗透 相关 的 模型 ， 这 个 模型 是 许多 自然 现象 的 
基础 。 但 是 我 们 不 会 太 多 关注 模型 本 身 ， 我 们 的 重点 是 开发 模块 化 程序 来 解决 计算 任务 的 过 
程 。 我 们 找 出 可 以 独立 处 理 的 子 任务 ， 并 努力 确定 关键 的 基础 抽象 概念 ， 并 自 间 如 下 问题 : 有 
没有 哪些 已 往 的 子 任务 可 以 用 来 帮助 解决 这 个 问题 ? 那些 子 任务 的 基本 特征 是 什么 ? 具有 这 
些 基本 特征 的 子 任务 能 不 能 帮助 解决 其 他 问题 ? 提出 这 样 的 问题 带 来 巨大 的 益处 ， 因 为 它们 
引导 我 们 开发 更 容易 创建 、 调 试 和 复 用 的 软件 ， 以 便 我 们 能 够 集中 精力 解决 问题 的 关键 部 分 。 

渗透 在 一 些 系统 中 ， 局 部 结构 间 的 相互 作用 暗示 着 全 局 性 质 。 例 如 ， 电 气 工 程 师 可 能 
对 由 随机 分 布 的 绝缘 材料 和 金属 材料 组 成 的 复合 材料 感 兴趣 : 哪 一 部 分 材料 需要 是 金属 的 ， 
则 整 块 材料 可 以 导电 ? 又 如 ， 地 质 学 家 可 能 对 上 表面 有 水 〈 或 下 表面 有 石油 ) 的 多 孔 景 观感 
兴趣 。 在 哪些 条 件 下 ,水 能够 渗透 到 底部 (或 石油 可 以 喷涌 到 地 表 ) ? 科学 家 已 经 定义 了 一 
个 抽象 过 程 来 模拟 这 种 情况 ， 这 一 过 程 被 称 为 渗透 (Percolation)s 它 已 被 广泛 研究 并 被 证 明 
是 一 种 准确 而 有 效 的 模型 ， 它 的 应 用 多 得 令 人 眼花 绑 乱 ， 包 括 绝缘 材料 、 多 孔 物 质 、 森 林 火 
灾 的 草 延 、 疾 病 传播 和 互联 网 研究 。 

为 了 简单 起 见 ， 我 们 从 三 维 的 渗透 开始 。 我 们 将 系统 建 模 为 nXn 的 网 格 ， 每 个 网 格 可 
能 是 阻塞 的 或 者 是 开放 的 ; 开放 网 格 的 初始 状态 都 是 空 的 ， 如 果 一 个 开放 网 格 可 以 通过 与 相 
邻 位 置 ( 左 、 右 、 上 、 下 四 个 方向 ) 的 开放 网 格 的 连接 最 终 连 到 网 格 的 最 上 一 行 ， 这 个 开放 
网 格 被 称 为 连通 网 格 (fall site)。 如 果 系 统 的 底部 行 存在 一 个 连通 网 格 ， 那 么 我 们 说 系统 是 
渗透 (percolates) 的 。 换 句 话 说， 一 个 系统 是 渗透 的 渗 肖 





就 表示 ， 如 果 我 们 在 顶部 行 的 开放 网 格 里 注入 物质 ， -一 阻塞 网 络 
它 会 渗透 到 底部 的 开放 网 格 。 例 如 ， 对 于 绝缘 /金属 

材料 ， 开 放 网 格 对 应 金属 材料 ， 一 个 渗透 系统 即 金属 连通 的 
物质 连通 顶部 到 底部 。 对 于 多 和 孔 物质 的 例子 来 说 ， 开 宕 的 并 开放 网 络 
放 网 格 对 应 水 可 以 流 经 的 键 际 ， 一 个 渗透 系统 即 水 可 ” 放 网 络 、 ~ 

以 流 经 开放 网 格 ， 从 顶部 到 底部 。 连接 到 顶部 的 开放 网 格 


这 是 一 个 著名 的 科学 问题 ， 科 学 家 们 数 十 年 来 不 能 渗透 
一 直 在 深入 研究 。 而 其 中 的 一 个 关键 问题 是 : 如 果 每 
个 网 格 开 放 设 置 相互 独立 ， 互 不 影响 ， 且 网 格 开放 的 
概率 为 (因此 阻塞 概率 为 1-p)， 整 个 系统 渗透 的 概 
率 是 多 少 ? 这 个 问题 的 数学 解决 方法 尚未 得 出 。 我 们 
的 任务 是 编写 计算 机 程序 来 帮助 研究 这 个 问题 。 AS 

基础 脚手架 (scaffolding) 通过 Java 程序 来 解决 无 法 连接 到 项 部 的 开放 网 络 
渗透 问题 ， 我 们 面临 着 无 数 的 决策 和 挑战 ， 而 且 我 们 渗透 示例 
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还 会 编写 大 量 的 代码 ， 比 前 文中 我 们 已 经 学 过 的 短程 序 要 复杂 得 多 。 我 们 的 目标 是 展示 二 种 
渐进 式 的 编程 风格 ， 在 这 里 我 们 独立 地 开发 模块 来 解决 问题 的 每 一 个 部 分 ， 不 断 地 通过 设计 
和 架构 小 型 计算 模块 来 增强 信心 ， 并 最 终 解 决 整个 复杂 的 问题 。 

第 一 步 是 选取 数据 的 表现 形式 。 这 一 决定 可 能 会 对 我 们 以 后 编写 的 代码 类 型 产生 重大 影 
响 ， 因 此 不 应 掉以轻心 。 事 实 上 ， 我 们 经 常会 在 选择 表现 形式 后 不 得 不 放弃 它 ， 并 采用 一 个 
新 的 形式 ， 这 也 是 我 们 不 断 学 习 的 过 程 。 

对 于 渗透 问题 ， 有 效 的 数据 表现 形式 是 很 显然 的 : 使 用 一 个 nXn 的 
数组 。 我 们 应 该 为 每 个 元 素 使 用 哪 种 类 型 的 数据 ?一 种 方案 是 使 用 整数 ， 
约定 0 表示 一 个 开放 网 格 ，1 表示 一 个 阻塞 的 网 格 ，2 表示 一 个 连通 的 网 
格 。 或 者 ， 请 注意 ， 我 们 描述 网 格 是 为 了 回答 以 下 问题 : 网 格 是 开放 的 还 
是 阻塞 的 ? 网 格 是 连通 的 还 是 空 的 ? 网 格 的 这 些 特征 表明 ， 我 们 可 以 使 用 
一 个 布尔 类 型 的 nXn 数组 来 表示 整个 网 格 ， 其 中 每 个 元 素 可 以 用 true 或 者 
false 表示 。 我 们 把 这 样 的 二 维 数组 称 为 布尔 矩阵 。 使 用 布尔 矩阵 编写 的 代 
码 更 易 理 解 。 

布尔 矩阵 是 一 种 基础 的 数学 工具 ， 应 用 非常 广泛 。 但 是 ，Java 中 没有 
对 布尔 矩阵 数据 操作 的 原生 支持 。 但 是 ， 我 们 可 以 使 用 StdArrayIO( 见 程 
序 2.2.2 ) 来 实现 这 些 和 矩阵 的 读 写 操作 。 这 个 过 程 告 诉 我 们 一 个 基础 而 常用 
的 编程 原则 : 多 花 些 时 间 把 自己 的 库 做 得 通用 而 完善 ， 在 日 后 的 编程 工作 
中 就 会 不 断 得 到 回报 。 

虽然 最 终 我 们 将 使 用 随机 数据 ， 但 是 我 们 还 是 希望 能 够 通过 读 取 和 瑟 
入 文件 进行 交互 ， 因 为 随机 输入 的 调试 程序 可 能 使 得 开发 的 过 程 非常 低 效 。 
使 用 随机 数据 ， 每 次 运行 程序 时 都 会 得 到 不 同 的 输入 ; 而 修复 了 一 个 Bug 
之 后 ， 你 想 要 看 到 的 是 与 刚刚 使 用 的 相同 的 输入 ， 以 检查 修复 是 否 有 效 。 
因此 ,最 好 从 我 们 理解 的 一 些 特定 情况 开始 调试 程序 ， 并 将 输入 数据 保存 
在 格式 与 StdArrayIO 兼容 的 文件 中 (先是 维度 ， 然 后 是 按 行 优先 顺序 排列 
的 0 和 1 值 )。 

当 你 开始 解决 一 个 新 间 题 ， 而 这 个 问题 需要 涉及 多 个 源 代 码 文件 时 ， 
通常 你 需要 创建 一 个 新 文件 夹 (目录 ) 以 将 这 些 文件 与 你 可 能 正在 处 理 的 其 
他 文件 隔离 开 来 。 例 如 ,我 们 可 能 会 创建 一 个 名 为 percolation 的 文件 夹 来 
存储 此 案例 研究 所 需 的 所 有 文件 。 我 们 可 以 从 实现 和 调试 读 写 渗透 系统 的 基本 代码 开始 这 次 
的 工作 ， 接 着 是 创建 测试 文件 、 检 查 文件 是 否 与 代码 兼容 等 ， 然 后 再 考虑 渗透 部 分 的 工作 原 
理 。 这 种 类 型 的 代码 有 时 被 称 为 脚手架 ( scaffolding)， 很 容易 实现 ， 但 要 确保 一 开始 就 是 稳 
固 的 ， 这 样 在 处 理 主要 问题 时 就 不 会 分 心 。 

完成 了 上 面 的 工作 ， 现 在 我 们 可 以 转向 核心 代码 ,测试 一 个 布尔 矩阵 表示 的 系统 是 否 是 
可 渗透 的 。 我 们 可 以 把 这 个 任务 看 作 模拟 顶部 被 水 淹没 会 发 生 什么 (是 否 流 到 底部 ?)。 我 
们 的 第 一 个 设计 决定 是 我 们 将 要 有 一 个 flow() 方法， 该 方法 以 布尔 和 矩阵 isOpen[][] 作为 参 
数 〈 该 矩阵 描述 哪些 网 格 是 开放 的 )， 并 返回 另 一 个 布尔 矩阵 isFull[][]， 用 于 指定 哪些 网 格 
已 被 填 满 ( 即 转变 为 连通 网 络 一 一 译 者 注 )。 目 前 ,我们 完全 不 必 担 心 如 何 实现 这 一 方法 ; 
我 们 只 是 决定 如 何 组 织 计算 。 很 明显 ,我 们 希望 客户 代码 能 够 使 用 percolates() 方法 来 检查 
flow() 返回 的 数组 是 否 在 底部 有 任何 连通 的 网 格 。 


渗透 系统 
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Percolation (程序 2.4.1 ) 汇总 了 这 些 设 计 方 案 。 到 目前 为 止 ， 代 码 中 没有 执行 任何 有 趣 
的 计算 ， 当 我 们 完成 这 些 代码 的 运行 和 调试 这 些 代码 之 后 ， 就 可 以 开始 考虑 解决 实际 问题 
了 。 不 执行 计算 的 方法 (如 flowO) 有 时 称 为 存根 函数 (stub)。 有 了 存根 函数 ,我 们 就 可 以 
在 我 们 所 需要 的 上 下 文中 测试 和 调试 percolates0 和 main()。 我 们 将 程序 2.4.1 这 样 的 代码 称 
为 脚手架 ， 就 像 建 筑 工 人 在 搭建 建筑 物 时 使 用 的 脚手架 一 样 ， 这 种 代码 提供 了 我 们 开发 程序 
所 需 的 支持 。 在 编程 工作 的 一 开始 就 应 该 充分 实现 和 调试 这 些 代 码 〈 即 使 代码 还 不 完整 ， 我 
们 也 需要 它们 )， 为 构建 代码 解决 当前 的 问题 提供 了 和 良好 的 基础 。 通常， 我 们 将 这 个 比喻 推 
进一步 一 一 在 代码 实现 工作 完成 后 移 除 脚手架 (或 者 用 更 好 的 程序 替换 它 )。 303 





程序 2.4.1 渗透 程序 的 脚手架 





public class Percolation 
2 


public static boolean[][] flow(boolean[][] isOpen) 
{ 


int n = isOpen.length; 

boolean[][] isFull = new boolean[n] [n] ; 
1/ 计算 矩阵 TsFul11[][] 的 代码 应 该 写 在 这 里 
return isFu11; 


} 
public static boolean percolates(boolean[][] isOpen) 


boolean[][] isFull = filow(isOpen); 

int n = isOpen.length; 

for Cint 本 = 0; j] <n; j++) n 系统 大 小 (nxn) 上 
if (CisFull[n-1][j]) return true; isFu11[][] | 连通 网 格 

return false; isopen[][] | 开放 网 格 





} 
public static void main(String[] args) 


boolean[][] isOpen = StdArrayI0.readBoolean2D(); 
StdArrayI0.print(flow(isOpen)); 
StdOut.printin(percolates(isOpen)); 
} 
} 


为 了 开始 开发 渗透 程序 ， 我们 实现 并 调试 这 个 代码 ， 它 处 理 与 计算 直接 
关联 的 任务 。 函 数 flow() 返 回 一 个 布尔 矩阵 ， 给 出 连通 网 格 的 位 置 ( 应 该 就 
在 代码 中 的 占 位 符 位 置 ,目前 还 没 实现 ) 。 辅 助 函 数 percolates0 检 查 返回 矩阵 
的 底部 行 ， 以 决定 系统 是 否 渗透 。 测 试用 客户 程序 main() 从 标准 输入 中 读 取 
一 个 布尔 矩阵 ， 并 打印 该 矩阵 的 How0 和 percolates0 的 调用 结果 。 


java Percolation < testEZ.txt 


5 
0 
0 
0 
0 
0 


hoOoooouw 


0 0 
0 0 
0 0 
0 0 
0 0 
alse 


垂直 渗透 ”给 定 一 个 表示 开放 网 格 的 布尔 矩阵 ， 我 们 如 何 确定 它 是 否 是 一 个 渗透 系统 ? 
正如 我 们 在 本 节 后 面 会 看 到 的 ， 这 个 计算 结果 直接 关系 到 计算 机 科学 的 一 个 基本 问题 。 目 
前 ,我 们 将 考虑 一 个 更 简单 的 问题 ， 我 们 称 之 为 径直 渗透 (vertical percolation ) 。 

解决 这 个 问题 的 简化 办 法 是 只 关注 垂直 连接 路 径 。 如 果 这 样 的 路 径 从 顶部 到 底部 把 系统 
连接 了 起 来 ， 则 我 们 说 系统 沿 着 路 径 垂 直 渗 透 (并 且 系统 本 身 垂直 渗透 )。 如 果 我 们 谈论 的 是 
沙子 穿 过 水 泥 ， 而 不 是 讨论 水 穿 过 水 泥 或 电 传导 ， 那 么 这 个 限制 可 能 是 直观 而 合理 的 。 虽 然 
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垂直 渗透 很 简单 ， 但 它 仍 是 一 个 有 趣 的 问题 ， 因 为 它 衍 生出 了 多 个 数学 问题 。 这 种 限制 与 原 
二 来 的 系统 有 哪些 显著 的 区 别 ? 我 们 期 望 有 多 少 条 垂直 渗透 路 径 ? 
确定 网 格 是 和 否 能 够 通过 某 个 垂直 路 径 连 接 到 顶部 是 一 个 简单 的 计算 
过 程 。 我 们 根据 渗透 系统 的 第 一 行 初始 化 结果 数组 的 第 一 行 ， 然 后 从 上 
到 下 ， 我 们 通过 检查 渗透 系统 矩阵 的 相应 行 来 为 结果 数组 的 每 一 行 元素 
赋值 ， 即 : 在 isopen[][] 中 有 垂直 连通 上 一 行 的 连通 网 格 ， 就 在 isFull[][] 





CT pT 中 将 相应 元 素 标记 为 true。 程 序 2.4.2 是 Percolation 的 flow0 的 一 个 实 


| 现 ， 它 返回 整个 网 格 的 布尔 矩阵 (如 果 通 过 垂直 路 径 连接 到 顶部 ， 则 为 
:垂直 渗 ; 


true， 否 则 为 false)。 

测试 ” 当 我 们 确信 我 们 的 代码 按照 计划 运行 之 后 ， 我 们 希望 在 更 广 
泛 的 测试 用 例 上 运行 代码 ， 并 以 此 来 解决 一 些 科学 问题 。 在 这 一 点 上 ， 
我 们 最 初 的 脚手架 变 得 不 那么 有 用 了 ， 因 为 在 标准 输入 和 标准 输出 上 用 
A 0 和 1 表示 大 型 的 布尔 和 矩阵， 并 进行 大 量 的 测试 并 不 是 一 件 明智 的 事 。 
没有 开放 网 格 通过 相反， 我 们 希望 自动 生成 测试 用 例 ， 并 观 过 一条 填充 网 格 尼 
垂直 路 径 连 接 到 项 部 Sg EE 通过 一 条 填充 网 格 的 

察 代码 的 运行 情况 ， 确 保 它 能 够 按照 我 们 垂直 路 径 连接 到 项 部 


委 直 滩 寺 三 的 预期 运行 中 具体 来 说 定 为 予 保 证 代码 的 也 过 二 二 TAR 
正确 性 ， 并 且 更 好 地 了 解 渗透 ， 我 们 接 下 来 的 目标 是 : | 


。 使 用 大 型 随机 布尔 矩阵 测试 我 们 的 代码 。 
。 依 据 给 定 的 概率 p 评估 系统 渗透 的 概率 。 

为 了 实现 这 些 目标 ， 我 们 需要 新 的 客户 程序 ， 这 些 客户 也 RE 拉 到 硕 中 通过 这 条 路 和 
程序 要 比 用 来 启动 和 运行 程序 的 脚手架 稍微 复杂 一 些 。 我 们 和 
的 模块 化 编程 风格 是 在 独立 的 类 中 开发 这 样 的 客户 程序 ， 无 垂直 渗透 计算 示意 图 
须 修改 我 们 的 渗透 代码 。 








程序 2.4.2 “垂直 渗透 检测 








public static boolean[][] flow(boolean[][] isOpen) 
{ /W 计算 垂直 渗透 的 连通 网 格 
int n = isOpen.length; 
boolean[][] isFul11 = new boolean[n] [n] ; 系统 大 小 (nxn) 
forstintsj= 0; 了 去 坟 十 和 和 
isFul1[0][j] = js0pzntgj [j]; a a 
for Cint 1 = 1 1 < hn; i++ - 
for (int j = 0; j < n; j++) 4 人 
isFull[i][j] = isOpen[i][j] && isFull[i-1][j]; 
return isFull; 








将 这 种 方法 替换 为 程序 2.4.1 中 的 存根 函数 ， 可 以 解决 仅 垂直 渗透 问题 ， 以 及 
按照 预期 处 理 我 们 的 测试 用 例 ( 详 见 正文 ) 。 


% more test5.txt % java Percolation < test5.txt 
5: $3 

DLA 0- 基于 9 

VQ OE 00101 

0 2 届 00001 

1-0.0 二 00001 

和 -二 区 00001 

true 


函数 和 科 妇 781 


数据 可 视 化 。 如 果 使 用 StdDraw 进行 输出 ， 我 们 就 可 以 处 理 更 大 的 问题 实例 。 以 下 
Percolation 类 的 静态 方法 允许 我 们 将 布尔 矩阵 的 内 容 以 可 视 化 的 形式 呈现 为 一 个 StdDraw 夯 
布 ， 画 布 被 细 分 成 很 多 小 正方 形 ， 每 个 小 正方 形 对 应 一 个 网 格 : 


public static void show(boolean[][] a，boolean which) 


int n = a.length; 
StdDraw.setXscale(-1, n); 
StdDraw.setYscale(-1, n); 
for (int i = 0; i < n; i++) 
for Cint j = 0; j < n; j++) 
if (a[i][j] == which) 
StdDraw.filledSquare(j, n-i-1, 0.5); 
了 
第 二 个 参数 which 指定 我 们 要 给 哪些 方块 填充 颜色 ， 以 对 应 true 的 元 素 或 false 的 元 
素 。 这 种 方法 虽然 有 点 偏离 了 计算 的 目的 ,但 是 它 能 够 帮助 我 们 将 大 型 问题 可 视 化 。 气 数 
show() 通过 用 不 同 颜色 填充 网 格 来 代表 布尔 矩阵 中 的 阻塞 和 连通 的 元 素 ， 这样 就 完成 了 一 个 
渗透 过 程 的 可 视 化 图 像 。 
蒙特 卡 罗 模 拟 。 我 们 希望 我 们 的 代码 可 以 在 任何 布尔 和 矩阵 中 都 能 正常 工作 。 此 外 ， 在 这 
个 科学 问题 的 研究 中 我 们 往往 需要 使 用 随机 布尔 矩阵 。 为 此 ， 我 们 为 Percolation 添加 另 一 
个 静态 方法 : 


public static boolean[][] random(int n, double p) 
boolean[] [] a = new boolean[n][n]; 
for Cint 1 =0; i < mi; 
for (ipt 3 = 0 -1x ++) 
afi 果 ] 二 SR bernoui11TCDS 
return a; 


该 方法 对 于 任何 一 个 给 定 的 可 以 生成 一 个 大 小 为 nXn 的 随机 布尔 矩阵， 每 个 元 素 为 
真 的 概率 为 p。 

在 几 个 特定 的 测试 用 例 上 调试 过 我 们 的 代码 后 ， 我 们 准备 在 随机 系统 上 测试 它 。 这 种 情 
况 仍然 可 能 会 发 现 一 些 新 的 错误 ， 所 以 还 是 要 注意 检查 结果 的 正确 性 。 但 是 对 代码 片段 进行 
测试 还 是 有 意义 的 ， 在 对 一 段 代码 进行 小 规模 的 测试 之 后 ， 把 它们 集成 进 大 系统 时 我 们 就 会 
对 代码 更 有 信心 。 而 明 在 消除 了 明显 的 错误 之 后 ， 可 以 集中 精力 关注 新 错误 。 

开发 完了 这 些 工 具 ， 我 们 就 可 以 很 容易 地 在 更 大 型 的 试验 上 测试 我 们 的 Percolation 代 
码 了 。PercolationVisualizer (程序 2.4.3 ) 仅 包 含 一 个 main0 方法 ， 它 从 命令 行 提 取 n 和 p， 
并 显示 渗透 计算 的 结果 。 

这 种 客户 程序 是 非常 典型 的 。 我 们 最 终 的 目标 是 准确 估计 渗透 概率 的 值 ， 通 过 大 量 的 试 
验 就 可 以 估算 出 来 ， 而 这 个 简单 客户 程序 的 作用 是 使 我 们 借助 一 些 大 型 案例 的 求解 过 程 来 进 
一 步 了 解 这 个 问题 (同时 获得 对 我 们 代码 能 够 正常 运行 的 信心 )。 在 进一步 阅读 之 前 ， 建 议 
你 从 本 书 官网 下 载 并 运行 此 代码 以 研究 渗透 过 程 。 当 你 运行 中 等 大 小 的 n 阶 (比如 ，50 到 
100 ) 程序 PercolationVisualizer 和 各 种 p 值 时 ， 你 会 乐意 于 使 用 这 个 程序 来 回答 一 些 关 于 渗 
透 的 问题 。 例 如 ， 显 然 ， 当 bp 值 很 低 时 ， 系 统 不 会 渗透 ， 当 pp 值 非常 高 时 ， 系 统 总 是 渗透 
的 ; 当 p 取 中 间 值 时 ， 系 统 如 何 表 现 ? 随 着 n 的 增加 系统 如 何 变化 ? 

估计 概率 ”我 们 程序 开发 过 程 的 下 一 步 是 编写 代码 来 估计 随机 系统 (大 小 为 n， 网 格 开 
放 概 率 为 p) 渗透 的 概率 ， 我 们 称 之 为 渗透 概率 (percolation probability)。 为 了 估计 它 的 值 ， 
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我 们 只 需要 进行 足够 多 次 数 的 试验 ， 这 与 投掷 硬币 的 研究 没有 什么 不 同 〈 见 程序 2.2.6 )， 唯 
一 的 区 别 就 是 这 次 我 们 生成 一 个 随机 系统 并 检查 它 是 否 渗透 。 

PercolationProbability (程序 2.4.4 ) 将 这 个 计算 封装 在 一 个 方法 estimate() 中 ， 该 方法 
需要 三 个 参数 n、p 和 trials : n 为 系统 的 大 小 、p 为 网 格 开放 概率 、trials 为 生成 的 随机 系统 
的 次 数 。 利 用 这 三 个 参数 计算 系统 的 渗透 概率 ， 最 终 返 回 这 个 概率 值 。 

我 们 需要 进行 多 少 次 试验 才能 获得 准确 的 估计 ? 这 个 问题 是 通过 概率 和 统计 学 的 基本 方 
法 来 解决 的 ， 这 些 方法 超出 了 本 书 的 范围 ， 但 是 我 们 可 以 通过 多 次 计算 过 程 的 直观 感受 来 回 
答 这 个 问题 。 通 过 几 次 PercolationProbability 的 运行 ， 你 可 以 得 知 ， 如 果 网 格 开放 概率 接近 
于 0 或 1， 那 么 我 们 不 需要 很 多 的 试验 ,但 是 对 于 某 些 开放 概率 的 值 ， 我 们 需要 多 达 10000 
次 试验 才能 够 将 结果 估计 到 小 数 点 后 两 位 。 为 了 更 详细 地 研究 这 种 情况 ， 我 们 可 以 修改 程 
序 ， 以 达到 类 似 Bernoulli (程序 2.2.6 ) 的 输出 ， 通 过 绘制 数据 点 的 直方 图 ， 以 便 看 到 值 的 


分 布 (参见 练习 2.4.9 ) 。 


程序 2.4.3 ”可视化 显示 的 客户 端 





n 系统 大 小 (nxn) 
p 网 格 开放 概率 
isopen[][r] | 开放 网 格 
int n = Integer.parseInt(args[0]); isFul100 上 连通 网 格 
double p = Double.parseDouble(args[1]); 
StdDraw.enableDoubleBufferingO); 
/ 将 蛆 塞 网 格 用 黑色 填充 
boolean[][] isOpen = Percolation.random(n, p); 
StdDraw.setPenColor(CStdDraw.BLACK) ; 
Percolation.show(isOpen, false); 
1 将 和 连通 网 格 用 蓝 色 填 充 ( 书 中 显示 为 灰色 ) 
StdDraw.setPenColor(StdDraw.BOOK_BLUE); 
boolean[][] isFull = Percolation.flow(isOpen); 
Percolation.show(isFull, true); 


public class PercolationVisualizer 


public static void main(String[] args) 


StdDraw.showO) ; 
上 
上 















这 个 客户 端 使 用 两 个 命令 行 参数 n 和 p， 生成 二 个 网 格 开 放 概 率 为 p、 大 小 
为 nxn 的 随机 系统 ， 并 确定 哪些 网 格 是 连通 的 ， 并 在 标准 绘图 中 绘制 ; .下 图 
显示 的 是 垂直 渗透 的 结果 。 


% java PercolationVisualizer 20 0.9 % java PercolationVisualizer 20 0.95 








使 用 PercolationProbability.estimate() 会 产生 计算 量 的 巨大 飞跃 ， 它 会 一 下 子 产 生 数 
千 万 次 的 实验 过 程 调用 。 如 果 没 有 彻底 测试 过 我 们 的 渗透 方法 ， 直 接 尝 试 这 样 做 是 很 不 
明智 的 。 另 外 ， 我 们 还 需要 注意 完成 计算 所 花费 的 时 间 。 估 计 程 序 运行 时 间 是 :4.1 节 的 
主题 ， 目 前 这 些 程序 的 结构 非常 简单 ， 我 们 可 以 很 容易 地 估算 它 的 运行 时 间 ， 然 后 运行 
程序 来 验证 我 们 的 估算 结果 。 如 果 我 们 进行 7 个 试验 ， 其 中 每 个 试验 涉及 we 个 网 格 ， 则 
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PercolationProbability.estimate() 的 总 运行 时 间 与 nT 成 正比 。 如 果 我 们 将 T 增 加 10 倍 (以 
获得 更 高 的 精确 度 )， 则 运行 时 间 将 增加 10 倍 。 如 果 我 们 将 nn 增加 10 售 (为 了 研究 更 大 系 
统 的 渗透 )， 运 行 时 间 会 增加 大 约 100 倍 。 

对 于 一 个 具有 几 十 亿 个 网 格 的 系统 , 我们 是 否 可 以 通过 运行 这 个 程序 ， 将 其 渗透 概率 精 
确 到 小 数 点 后 多 位 ? 答案 是 否定 的 ， 因 为 没有 计算 机 具备 如 此 高 的 运行 速度 ， 能 在 可 以 接受 的 
时 间 内 执行 完 PercolationProbability.estimate() 的 调用 。 而 且 ， 在 渗透 的 科学 实验 中 , 7 的 值 可 
能 要 高 得 多 。 我 们 可 以 假设 能 够 在 一 个 更 大 的 计算 机 系统 里 进行 这 些 试验 ， 但 任何 计算 机 系 
统 都 不 可 能 完全 从 原子 量 级 上 精确 模拟 真实 世界 的 系统 。 因 此， 简化 在 科学 中 是 至 关 重要 的 。 

我 们 鼓励 你 从 本 书 官网 下 载 PercolationProbability， 以 了 解 渗透 概率 以 及 计算 它们 所 需 
的 时 间 。 在 这 个 过 程 中 ， 你 不 仅 可 以 学 习 渗 透 程 序 的 原理 ， 而 且 还 可 以 验证 我 们 刚刚 对 其 运 
行 时 间 提 出 的 假设 。 

一 个 网 格 开放 概率 为 p 的 系统 ， 其 垂直 渗透 的 概率 是 多 少 ? 垂直 渗透 相当 简单 ， 基 本 的 
概率 模型 可 以 为 渗透 概率 产生 精确 的 公式 ， 并 通过 PercolationProbability 来 验证 。 由 于 我 们 
研究 垂直 渗透 的 唯一 原因 是 其 可 作为 开发 研究 渗透 方法 的 支撑 软件 的 起 点 ， 所 以 我 们 将 进 一 
步 研究 一 个 垂直 渗透 系统 作为 练习 题 (参见 练习 2.4.11 )， 随 后 转向 主要 问题 。 












程序 2.4.4 ”渗透 概率 估计 
public class PercolationProbability 


public static double estimate(int n, double p, int trials) 
{ -1/ 生成 随机 大 小 nxn 的 试验 系统 ， 并 返回 
// 渗透 概率 估计 
int count = 0; 
for (Cint t = 0; t < trials; t++) 
{ /生成 一 个 随机 大 小 nxn 的 布尔 矩阵 
boolean[] [] isOpen = Percolation.random(n, p); 
if (Percolation.percolates(isOpen)) count++; 













} 
return (double) count / trials; pF 系统 大 未 (nxn) 


public static void main(String[] args) p 网 格 开放 概率 
{ trials 试验 次 数 
int n = Integer.parseInt(args[0]); isopen[] [] | 开放 网 格 









double p = Double.parseDouble(args[1]); q 渗透 概率 
int trials = Integer.parseInt(args[2]); = 
double q = estimate(n, p, trials); 
WstdOut .print1in(q); 

} 







} 


方法 estimate0 生 成 随机 大 小 nxn 的 试验 系统 ， 其 网 格 开放 概率 为 p， 并 
计算 沙 透 概率 。 这 是 一 个 伯 努 利 过 程 ， 像 投掷 硬币 一 样 ( 见 程 序 2.2.6) 。 增 
加 试验 次 数 会 增加 估计 的 准确 性 。 如 果 p 接 近 于 0 或 者 1, 则 不 需要 很 多 试验 来 
实现 准确 的 估计 。 程 序 运行 结果 如 下 。 











% java PercolationProbability 20 0.05 10 

只 PercolationProbability 20 0.95 10 

况 训 PercolationProbability 20 0.85 10 
"7 

: java PercolationProbability 20 0.85 1000 

0.564 


% java PercolationProbability 40 0.85 100 
0.1 
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渗透 的 递归 解决 方案 “在 一 般 情 况 下 ， 我 们 如 何 测试 一 个 系统 从 顶部 开始 到 底部 的 任 一 


路 径 《〈 而 不 仅仅 是 垂直 的 ) 是 否 渗 透 ? flow(...,0,0) 
这 个 问题 可 以 使 用 一 个 简洁 的 程序 来 解决 ， 这 一 个 经 和 
典 的 递归 解决 方案 即 深度 优先 搜索 (depth-first search ) 。 | 


程序 2.4.5 中 的 方法 flow() 就 是 这 个 方法 的 一 个 实现 ， 可 -十 
以 用 于 计算 矩阵 isFull[][]。 该 方法 需要 4 个 参数 ， 分 别 到 
是 存储 每 个 网 格 是 否 开 放 的 矩阵 isOpen[][]、 当 前 矩阵 Pe EE 
isFull[][]， 以 及 用 于 指定 当前 网 络 位 置 的 行 索 引 i 和 列 索 
引 j。 基 础 步骤 是 满足 以 下 任何 一 个 条 件 ， 就 不 做 任何 操 
作 立 刻 返 回 (我 们 将 这 种 调用 称 为 空调 用 ): 

。 i 或 j 在 数组 边界 之 外 。 

。 网 格 被 阻塞 (isOpen[ 相 [四 为 false)。 

。 我 们 已 经 将 该 网 格 标记 为 连通 的 (isFull[i][0] 为 真 )。 

归 约 步骤 是 将 网 格 标记 为 连通 的 并 对 它 的 四 个 邻居 进 
行 递归 调用 : isOpen[i+1][j],isOpen[i][j+1],isOpen[ 引 [1]， 
isOpen[i-1][ 门 。 单 参数 版 本 的 flow() 会 为 顶层 行 中 每 个 网 
格调 用 这 个 递归 版 本 的 flow0) 方 法 。 递 归 最 终 会 停 下 来 ， 
因为 每 次 递归 调用 要 么 是 个 空调 用 即 什么 也 没 做 ， 要 么 会 
将 一 个 网 格 标识 为 连通 。 我 们 可 以 通过 数学 归纳 法 来 证 明 
当 且 仅 当 一 个 网 络 与 顶层 是 连通 的 ， 这 个 网 格 才 会 被 标记 型 : 有 
为 full (就 像 其 他 递归 程序 的 证 明 方法 一 样 )。 

在 一 个 很 小 规模 的 测试 用 例 中 追踪 flow() 的 执行 过 程 归 递 渗 通 (省 略 空 调用 ) 
是 一 个 有 益 的 练习 。 你 会 看 到 它 为 每 一 个 可 以 通过 开放 网 格 的 路 径 连 接 到 顶层 行 的 网 格调 用 
了 flow() 方法 。 从 这 个 例子 中 可 以 看 到 ,一 些 非常 复杂 的 计算 过 程 ， 可 以 通过 递归 程序 以 很 
简单 的 方式 实现 。 该 方法 也 是 深度 优先 搜索 算法 的 一 个 特例 ， 具 有 很 多 重要 的 应 用 。 

为 了 避免 与 我 们 的 垂直 渗透 (程序 2.4.2 ) 的 解决 方案 发 生 冲 突 ， 我 们 可 以 将 那个 类 
重 命 名 为 PercolationVertical， 然 后 男 外 复制 一 份 Percolation (程序 2.4.1 )， 用 程序 2.4.5 
中 的 两 个 flow() 方 法 蔡 换 掉 占 位 符 flow()。 完 成 这 些 之 后 ,我们 可 以 用 我 们 已 经 开发 的 
PercolationVisualizer 和 PercolationProbability 工具 来 执行 这 个 算法 的 实验 并 以 可 视 化 的 方式 
呈现 结果 。 如 果 这 样 实施 并 尝试 n 和 pp 的 各 种 值 ， 你 会 很 快 得 到 这 样 的 直观 感受 : 系统 总 是 
在 网 格 开放 概率 p 较 高 时 渗透 ， 而 在 p 较 低 时 不 会 渗透 ; 特别 是 当 n 较 大 时 ， 存 在 一 个 特殊 
的 概率 值 ， 当 p 大 于 这 个 值 时 系统 (几乎 ) 总 是 渗透 的 ， 而 低 于 这 个 值 (几乎 ) 就 不 会 渗透 。 

因为 已 经 在 简单 垂直 渗透 过 程 中 对 PercolationVisualizer 和 PercolationProbability 进行 
了 调试 ， 我 们 可 以 更 有 信心 地 使 用 它们 来 研究 渗透 ， 并 迅速 开始 研究 我 们 感 兴趣 的 科学 问 
题 。 请 注意 ， 如 果 我 们 想 再 次 尝试 垂直 渗透 ， 那 么 我 们 需要 修改 PercolationVisualizer 和 
PercolationProbability， 使 它们 引用 PercolationVertical 类 而 不 是 Percolation 类 ， 或 者 编写 
PercolationVertical 和 Percolation 的 新 的 客户 程序 来 同时 运行 两 个 类 中 的 方法 来 比较 它们 。 

适应 性 绘图 为 了 更 深入 地 了 解 渗 透 ， 程 序 开发 的 下 一 步 是 编写 一 个 程序 ， 将 渗透 概率 
作为 给 定 的 系统 规模 n 和 开放 概率 p 的 函数 ,绘制 出 函数 曲线 。 也 许 产生 这 种 绘图 的 最 好 方法 
是 首先 为 该 函数 导出 一 个 数学 方程 ， 然 后 用 这 个 方程 来 绘制 该 图 。 然 而 ， 对 于 渗透 问题 ， 没 有 
人 能 够 推导 出 这 样 的 方程 ， 所 以 下 一 个 选择 是 使 用 蒙特 卡 罗 方 法 : 运行 模拟 实验 并 绘制 结果 。 
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旦 序 2.4.5 “渗透 检测 





public static Ro San ET fi 
{-“// 填充 每 一 个 能 与 顶 行 连接 
Tht n= isOpen. length; Ge 
boolean[][] isFill = new booleantnj[tn]; in 系统 大 小 (nxn ) 
for (int j = 0; j <n; j++) isopen[][] | 开放 网 格 
flow(isOpen, isFull, 0; j); isFu11[][] | 连通 网 格 
return isFu11; ur] 当前 网 格 的 行 和 ls 标 





public static void flow(boolean[]J[] isOpen, 
boolean[] [] JsFEul Snt ,int 3 
{WU 填充 每 一 个 能 与 (有) 舌 接 的 网 格 
int n = isFull.length; 
if (i &0, | .i>= 1 return; 
if G < 0 || ja n) retorn; 
if (!isOpen[i][j]) return; 
if (CisFull[i][j]) return; 
isFul1i[i][j] = true; 
flowCisOpen, isFull1, i+1, j); /下 
flow(isOpen, isFull, i, j+1); /上 
flow(isOpen, isFull, i，j-1); // 左 
flowCisOpen, isFull, i-1, j); 办 藻 








用 这 些 方法 替换 程序 2.4.1 中 的 存根 程序 ， 可 以 得 到 渗透 问题 的 基于 深度 优 
先 搜 索 的 解决 方案 。 如 果 和 矩阵 中 的 一 个 点 可 以 通过 一 系列 邻接 的 开放 网 格 连 接 
ei ， 那 么 递归 函数 fow0 会 将 isFull 上 中 对 应 的 元 素 设置 为 ue 

页 行 的 每 一 个 网 格调 用 递 上 








% more test8.txt % java Percolation < test8 .txt 
8 8 8 8 
00111000 00111000 
1 0 二 9r0uQtl 1 B11 
i001 00000110 
00110111 00000111 
Qi el-0 00000110 
01000011 00000011 
F O00O0L I 
1 1000 00000100 
true 





随 着 网 格 开放 概率 p 降低 ， 渗透 的 可 能 性 降低 


接 下 来 ， 我 们 需要 做 出 无 数 个 决定 。 为 了 估计 渗透 概率 ， 我 们 应 该 计算 多 少 个 开放 概 
率 p ? 我 们 应 该 为 p 选择 哪些 值 ? 在 这 个 模拟 实验 的 过 程 中 ， 我 们 的 计算 精度 应 该 是 多 少 ? 
这 些 问题 其 实 是 在 探讨 我 们 应 该 如 何 合理 地 设计 一 个 实验 。 我 们 很 想 为 任何 给 定 的 于 绘制 一 
条 准确 的 曲线 ， 然 而 这 样 的 计算 成 本 可 能 是 令 人 望而却步 的 。 例 如 ， 首 先 你 想到 的 是 使 用 
StdStats (程序 2.2.5 ) 生成 100 或 者 1000 个 等 距 点 ， 为 每 个 点 获得 函数 值 就 可 以 完成 曲线 绘 
制 。 但 是 ， 从 程序 PercolationProbability 的 实验 中 你 已 经 得 知 ， 计 算 每 个 点 的 渗透 概率 的 精 
确 值 可 能 需要 几 秒 或 更 长 时 间 ， 因 此 整个 处 理 完 所 有 这 些 点 可 能 需要 几 分 钟 或 几 小 时 甚至 更 
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长 的 时 间 。 而 且 ， 显然 很 多 计算 时 间 是 完全 浪费 的 ， 因 为 我 们 知道 小 p 的 值 是 0， 大 pp 的 值 

是 1。 我 们 可 能 更 喜欢 把 时 间 花 在 精确 地 计算 中 间 p 值 的 过 程 中 。 我 们 应 该 如 何 着 手 ? 
PercolationPlot (程序 2.4.6 ) 实现 了 一 个 递归 的 方法 ， 其 结构 与 Brownian (程序 2.3.5 ) 相同 ， 

广泛 适用 于 类 似 的 问题 。 其 基本 思想 很 简单 : 我 们 设 定 x 坐标 值 之 间 的 最 大 距离 (我 们 称 之 为 


间隙 容 限 ), 坐标 中 允许 的 最 大 已 知 误差 ( 它 我 们 称 之 为 误差 
容 限 )， 以 及 每 个 点 的 重 试 次 数 7。 递 归 方 法 在 给 定 区 间 [xo， 
x 内， 在 (x0,，y%) 到 (x,， 1) 之 间 绘 图 。 对 于 我 们 的 问题 ， 
图 像 是 从 (0, 0) 到 (1,1 )。 基 础 步骤 是 如 果 xo。 和 xi 之 间 的 
距离 小 于 间 际 容 限 ， 或 者 连接 两 个 端点 的 线 与 中 点 上 的 函数 值 
之 间 的 距离 小 于 误差 容 限 ， 则 只 须 简单 地 画 一 条 连接 (xo，yo) 
到 (x1, y1) 的 直线 。 归 约 步 又 是 (递归 地 ) 分 别 绘 制 曲线 的 
两 个 半 部 分 (xo、yo) 和 (xm、flxm)) 和 (xm,flxm)) 与 (xi)。 
PercolationPlot 中 的 代码 相对 简单 ， 并 以 较 低 的 成 本 产生 


G7) 





和 % 自 适应 绘图 容 限 


了 效果 不 错 的 曲线 。 我 们 可 以 用 它 来 研究 n 取 不 同 值 时 曲线 的 形状 变化 ， 或 者 选择 更 小 的 容 限 
来 使 得 曲线 更 加 接近 实际 值 。 理 论 上 ， 这 种 估算 方法 的 偏差 是 可 以 用 精确 数学 表述 推导 出 来 的 ， 


但 是 在 探索 和 实验 时 过 度 细 化 可 能 是 不 恰当 的 ， 因 为 我 们 的 目标 只 


设 ， 然 后 通过 科学 实验 来 验证 它 。 







程序 2.4.6 自 适 应 绘图 客户 程序 


public class PercolationPlot 









public static void curve(int n, 
double x0，double y0， 


{ / 进行 实验 并 绘制 曲线 
double gap = 0.01; 
double err = 0.0025; 
int trials = 10000; 
double xm = (x0 + x1)/2; 
double ym = (y0 + y1)/2; 
double fxm = PercolationProbability.estimate(n, 
if (x1 - x0 < gap || Math.abs(ym - fxm) < err) 


StdDraw. filledci a fxm, 0.005); 
123 





public static void mai NT ng[] args) 
为 nxXm 的 渗透 系统 给 

int n = Integer. 估 约 二 全 二 全 的 于 
curve(n, 0.0, 0.0, 1.0, 1.0); 


} 


格 开 放 概 率 p 《控制 变量 ) 的 函数 关系 图 。 





% java PercolationPlot 20 


1 


渗透 概率 


0.593 1 


网 格 开放 概率 p 


double x1, double y1) x0,y0 | 左 侧 端点 
x1,， yl | 右 侧 端 点 


xm, trials); 


StdDraw.line(x0, y0, x1, y1); xm,，ym | 中 点 
return; fxm | 中 点 处 的 值 
curve(n, x0, y0, Xm) ; gap ”| 间隙 容 限 


误差 容 限 ， 
实验 次 数 


curve(n, xm, fxm, x1, y YE 
} trials 






这 个 递归 程序 绘制 了 在 nx n 的 随机 系统 中 ,渗透 概率 〈 实验 观测 值 ) 与 网 


% java PercolationPlot 100 


是 建立 一 个 关于 渗透 的 假 
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事实 上 ，PercolationPlot 产生 的 曲线 立即 证 实 了 阅 值 存在 的 假设 ( 约 0.593 ) : 如 果 p 大 


于 国 值 ， 那 么 系统 几乎 可 以 肯定 地 渗透 ; 如 果 p 小 于 立 
值 ， 那么 系统 几乎 肯定 不 会 渗透 。 随 着 的 增加 ， 曲 线 
在 阔 值 附近 变化 越剧 烈 ， 最 终 接 近 一 个 阶 路 函数， 在 阔 
值 处 值 从 0 改变 为 1。 这 种 现象 称 为 相 变 (phase 
transition)， 在 许多 物理 系统 中 都 有 发 现 。 

程序 2.4.6 输出 的 简单 形式 掩盖 了 它 背 后 的 大 量 计 
算 。 例 如 ， 对 于 n=100 绘制 的 曲线 具有 18 个 点 ， 每 个 
是 10 000 次 试验 的 结果 ， 每 个 试验 涉及 天 个 网 格 。 生 
成 和 测试 每 个 网 格 都 需要 执行 若干 行 代 码 ， 所 以 这 个 图 
是 以 执行 数 十 亿 条 语句 为 代价 的 。 从 这 个 观察 中 可 以 学 
到 两 个 教训 。 首 先 ， 我 们 需要 对 可 能 执行 数 十 亿 次 的 任 
何 代码 行 充满 信心 ， 所 以 我 们 谨慎 地 逐步 开发 和 调试 代 
码 是 合理 的 。 其 次 ， 虽 然 我 们 可 能 对 更 大 的 系统 感 兴 
趣 ， 但 我 们 需要 进一步 研究 计算 机 科学 来 处 理 更 大 的 情 
况 ， 也 就 是 开发 更 快 的 算法 以 及 有 一 套 获得 算法 性 能 特 
征 的 框架 。 

如 果 我 们 复 用 以 前 实现 过 的 所 有 代码 ， 只 要 实现 不 
同 版 本 的 flow() 方法， 就 可 以 研究 渗透 问题 的 各 种 变 
体 。 例如， 如 果 在 程序 2.4.5 的 flow0 方法 中 删 掉 最 后 
一 个 递归 调用 ， 它 就 变 成 了 另外 一 种 渗透 模型 。 这 种 模 
型 的 特殊 之 处 在 于 它 不 考虑 上 升 的 路 径 ， 我 们 称 之 为 定 
向 渗透 (directed percolation)。 这 种 模型 可 能 对 于 通过 多 
孔 岩 石 的 液体 渗透 (其 中 重力 作用 使 得 液体 不 会 向 上 渗 
透 ) 等 类 似 的 情况 而 言 是 重要 的 ,但 是 对 于 电 连 通 性 等 
类 似 的 情况 则 不 适用 。 如 果 你 为 两 种 方法 都 运行 
PercolationPlot 方法， 你 能 辨别 它们 的 差异 吗 ( 见 练习 
2. 本 108.3 


PercolationPlot.curve() 


PercolationProbability.estimate() 
Percolation.random() 
StdRandom.bernoulliQ) 
` 7 次 
StdRandom.bernou11i 0O) 
return 
Percolation.percolates() 
flow() 
return 
return 


3 

Percolation.random() 

StdRandom.bernoul1iQO 
”次 

StdRandom.bernoull1iQO 

return 

Percolation.percolates() 
filowO 
return 

return 

return 


ny 上 . . 人 
PercolationProbabi1ity.estimateC) 
Percolation.random() 
StdRandom.bernoul11i() 


”从 


StdRandom.bernoul1i0) 
return 
Percolation.percolates() 

lowO 

return 
return 

zx 人 次 


Percolation.random() 

StdRandom.bernoul1i() 
; 14 次 

StdRandom.bernoull1i() 

return 

Percolation.percolates() 
flowO 
return 

return 

return 


return 


PercolationPlot 的 函数 调用 跟踪 


为 了 模拟 诸如 流 经 多 孔 物 质 的 水 的 物理 情况 ， 我 们 需要 使 用 


可 以 渗透 【没有 疝 上 的 路 径 ) 


三 维 数组 。 在 三 维 问题 中 ,是否 有 类 似 的 阔 值 ? 如 果 是 这 样 ， 它 的 
值 是 什么 ”深度 优先 搜索 对 于 研究 这 个 问题 是 有 效 的 ,但 是 增加 一 
个 维度 需要 我 们 更 加 关注 确定 一 个 系统 渗透 的 计算 成 本 (参见 练习 
2.4.18 )。 科 学 家 也 研究 了 更 复杂 的 网 格 结构 ， 这 些 网 格 结构 可 能 无 
法 很 好 地 用 多 维 数组 建 模 一 一 我 们 将 在 4.5 节 中 看 到 如 何 建 模 这 些 
结构 。 

通过 计算 机 实验 研究 渗透 是 非常 有 趣 的 ， 因 为 没有 人 能 够 通过 
几 个 自然 模型 从 数学 上 获得 渗透 的 阔 值 。 科 学 家 知道 这 个 值 的 唯一 
途径 就 是 使 用 Percolation 等 程序 进行 模拟 。 科 学 家 需要 做 实验 来 验 
证 渗透 模型 是 否 准 确 地 反映 了 自然 界 所 观察 到 的 现象 ， 是 否 需 要 进 
一 步 改 进 模型 (例如 ,使 用 不 同 的 网 格 结构 ) 等 。 渗 透 实 验 只 是 一 
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个 例子 ， 在 这 个 问题 中 计算 机 科学 成 为 整个 科学 研究 过 程 的 重要 组 成 部 分 ， 随 着 你 的 学 习 ， 
你 会 发 现 这 样 的 问题 会 越 来 越 多 。 

教训 “如 果 我 们 试图 设计 和 实现 一 个 单一 的 程序 来 研究 渗透 问题 ， 也 许 我 们 也 能 解决 
问题 ， 也 能 够 生成 程序 2.4.6 绘制 的 类 似 曲 线 ， 但 是 写 出 的 代码 可 能 会 多 到 数 百 行 。 在 计算 
机 技术 发 展 的 早期 ， 程 序 员 别 无 选择 ， 只 能 编写 和 使 用 这 样 的 程序 ， 并 花费 大 量 的 时 间 来 
找到 Bug 并 纠正 设计 阶段 的 错误 。 而 现在 我 们 可 以 做 得 更 好 ， 我 们 可 以 使 用 像 Java 这 样 的 
现代 编程 工具 ， 以 及 本 章 介绍 的 增 量 式 编程 风格 的 编程 ， 而 且 需 要 牢记 我 们 学 到 的 一 些 经 验 
教训 。 

做 好 准备 迎接 Bugs。 你 写 的 每 一 段 代 码 都 非常 有 可 能 包含 至 少 一 个 或 两 个 错误 ， 有 时 候 
其 至 更 多 。 编 写 一 小 段 代码 就 开始 调试 运行 ， 输 入 一 些 你 能 理解 的 小 型 测 斌 数据， 可 以 使 你 
更 轻松 地 找到 错误 ， 并 且 更 轻松 地 修复 它们 。 调 斌 完成 后 ， 你 可 以 把 它们 作为 库 函 数 ， 用 于 
构建 任何 新 的 客户 程序 。 

保持 模块 小 巧 。 你 一 次 只 能 关注 最 多 几 十 行 代码 ， 因 此 你 可 以 在 编写 代码 时 将 代码 分 解 
为 小 模块 。 如 果 你 在 编程 函数 库 ， 一 些 包含 相关 方法 库 的 类 最 终 可 能 会 包含 数 百 行 代 码 ; 在 
其 他 情况 下 ， 我 们 应 该 使 用 小 文件 。 

限制 交互 。 在 一 个 精心 设计 的 模块 化 程序 中 ， 大 多 数 模块 应 该 仅仅 依赖 于 数量 有 限 的 几 
个 模块 。 具 体 来 说 ,调用 大 量 其 他 模块 的 模块 需要 被 分 成 更 小 的 块 。 被 其 他 模块 大 量 调用 的 
模块 (这样 的 情况 在 你 的 程序 里 应 该 不 多 ) 需要 特别 注意 ， 因 为 如 果 你 需要 在 模块 的 API 中 
进行 修改 ， 则 必须 在 所 有 客户 程序 中 做 出 相应 的 调整 。 

逐步 开发 代码 。 对 于 每 一 个 小 模块 ， 你 应 该 开发 完 后 就 立刻 运行 和 调试 它们 。 这 样 在 任 
何 时 候 ， 你 需要 面 对 的 不 可 靠 的 代码 都 不 会 超过 几 士 行 。 如 果 你 把 所 有 小 模块 组 合成 一 个 大 
模块 ， 很 难 确 信 其 中 任何 一 个 都 没有 Bug。 尽 早 运行 代码 也 会 迫使 你 尽早 考虑 JWVO 格式 、 问 
题 实例 的 属性 以 及 其 他 问题 。 在 考虑 这 些 问 题 和 调试 相关 代码 时 获得 的 经 验 使 得 你 在 后 面 的 


代码 开发 工作 中 更 加 高 效 。 
Visualizer 


Percolation 
Plot 
StdRandom 


StdArrayI0 
















Percolation 
Probability 





案例 研究 依赖 关系 图 (不 包括 系统 调用 ) 


解决 一 个 更 容易 解决 的 问题 。 即 使 是 能 处 理 部 分 问题 的 解决 方案 ， 总 比 没有 解决 方 
案 好 ， 所 以 通常 先 把 最 简单 的 代码 放 在 一 起 ， 这 样 就 可 以 解决 一 个 特定 的 问题 ， 就 像 我们 
解决 垂直 渗透 问题 一 样 。 这 个 解决 方案 会 是 我 们 在 不 断 完 善 和 改进 的 过 程 中 的 第 一 步 。 我 
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们 可 能 通过 测试 更 广泛 的 测试 用 例 或 者 开发 支持 软件 来 更 全 面 地 理解 问题 ， 就 像 我 们 开发 
PercolationVisualizer 和 PercolationProbability 类 一 样 。 

考虑 一 个 递归 的 解决 方案 。 递 归 是 现代 编程 中 不 可 或 缺 的 工具 ， 你 应 该 学 会 并 确信 它 能 
解决 问题 。 如 果 你 还 没有 被 彻底 说 服 ， 那 么 你 可 能 希望 尝试 开发 一 个 非 递 归程 序 来 测试 一 个 
系统 是 否 会 渗透 ， 拿 它 来 与 Percolation 和 PercolationPlot 的 简单 和 优雅 相 比 较 ， 并 重新 考虑 
这 个 问题 。 

适时 地 建立 工具 。 我 们 的 可 视 化 方法 show() 和 随机 布尔 矩阵 生成 方法 random() 对 于 许 
多 其 他 应 用 程序 当然 是 有 用 的 ，PercolationPlot 的 自 适应 绘图 方法 也 是 如 此 。 将 这 些 方法 合 
并 到 适当 的 库 中 将 会 很 简单 。 相 比 于 实现 一 些 仅 供 渗透 问题 专用 的 方法 ， 实 现 这 些 通用 方法 
并 不 困难 (有 的 时 候 可 能 更 容易 )。 

尽 可 能 复 用 软件 。 我 们 的 StdIn、StdRandom 和 StdDraw 库 都 简化 了 本 节 开 发 代码 的 过 
程 ， 我 们 也 可 以 立即 复 用 诸如 PercolationVisualizer、PercolationProbability 和 PercolationPlot 
等 渗透 程序 来 开发 垂直 渗透 之 后 的 程序 。 在 你 写 了 几 个 这 样 的 程序 之 后 ， 你 可 能 会 发 现 自己 
开发 的 这 些 程序 可 以 在 其 他 蒙特 卡 罗 模 拟 的 程序 或 其 他 实验 数据 分 析 问 题 中 发 挥 作 用 。 

这 个 案例 研究 的 主要 目的 是 要 说 服 你 ， 模 块 化 编程 是 一 种 先进 而 有 效 的 编程 方法 。 虽 然 
没有 一 种 编程 方法 是 万 能 的 ， 但 我 们 在 本 节 中 讨论 的 工具 和 方法 将 有 助 于 你 攻克 复杂 的 编程 
任务 ， 否 则 这 些 任务 可 能 远 远 超 出 你 的 能 力 范围 。 

模块 化 编程 的 成 功 只 是 一 个 开始 。 相 比 于 我 们 已 经 考虑 过 的 类 库 即 静态 方法 模型 ， 现 代 
编程 系统 具有 更 加 灵活 的 编程 模型 。 在 接 下 来 的 两 章 中 ， 我 们 将 学 习 这 个 模型 ， 并 举例 说 明 
它 的 实用 性 。 
问答 环节 

问 : 编辑 PercolationVisualizer 和 PercolationProbability， 将 Percolation 重 命名 为 Percolation- 
Vertical 或 任何 我 们 想 研究 的 方法 似乎 非常 麻烦 。 有 更 简单 的 办 法 吗 ? 

答 : 是 的 , 这 是 第 3 章 将 要 讨论 的 一 个 关键 问题 。 除 此 之 外 ， 和 你 也 可 以 将 不 同 的 实 
现代 码 分 别 保存 在 不 同 的 子 目 录 中 ,但 这 可 能 会 引起 混淆 。 一 些 高 级 的 Java 机 制 (比如 
classpath) 也 能 解决 这 个 问题 ， 但 是 它们 也 有 自己 的 问题 。 

问 : 递归 版 本 的 flow() 方法 让 我 感到 头疼 。 我 怎样 才能 更 好 地 理解 它 在 做 什么 ? 

答 : 生成 一 些 你 已 经 知道 结果 的 数据 示例 ， 用 来 当 作 参数 运行 flow0 方法 ， 并 在 方法 中 
加 入 打印 函数 调用 跟踪 的 指令 。 经 过 几 次 运行 后 ， 你 将 获得 足够 的 信心 。 它 的 作用 就 是 ， 如 
果 一 个 开放 网 格 能 够 通过 一 系列 开放 网 格 的 邻接 关系 连接 到 起 始 网 格 ， 就 把 这 个 网 格 标记 为 
连通 的 。 

问 : 是 否 有 简单 的 非 递归 方法 来 识别 连通 的 网 格 ? 

答 : 有 几 种 方法 可 以 执行 基本 相同 的 计算 。 我 们 将 在 4.5 节 中 重新 讨论 这 个 问题 ， 到 时 
我 们 会 学 习 一 种 新 的 算法 : 广度 优先 搜索 (breadth-frst search)。 如 果 你 感 兴趣 的 话 ， 开 发 
flow() 的 非 递 归 实 现 是 一 个 艰难 的 任务 ， 也 肯定 是 一 个 有 益 的 练习 。 

问 : PercolationPlot (程序 2.4.6 ) 似乎 用 了 大 量 的 计算 才 产 生 了 一 个 简单 的 函数 图 。 有 
更 好 的 方法 吗 ? 

答 : 最 好 的 解决 方案 当然 是 找到 描述 这 个 函数 的 一 个 简单 的 数学 公式 ,但 是 几 十 年 来 科学 
家 们 无 法 得 出 这 个 公式 。 在 科学 家 找到 这 样 一 个 公式 之 前 ， 他 们 必须 求助 于 本 节 中 的 计算 实验 。 
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练习 


2.4.1 


融 2 得 





编写 一 个 程序 ， 它 需要 命令 行 参 数 n， 并 创建 一 个 nXn 的 布尔 和 矩阵， 假设 一 个 元 素 的 行列 坐标 
为 (i, 7)， 如 果 i 和 j 互 质 ， 则 设置 该 元 素 为 true， 否 则 为 false。 在 标准 绘图 上 显示 该 矩阵 ( 参 
见 练习 1.4.16 )。 然 后 ， 编 写 一 个 类 似 的 程序 来 绘制 n 阶 Hadamard 矩阵 〈 参 见 练习 1.4.29 )。 
最 后 ， 编 写 一 个 程序 来 绘制 一 个 布尔 矩阵 ， 对 于 矩阵 中 坐标 为 (za7) 的 元 素 ， 如 果 ( 1+x)' 的 展 
开 二 项 式 中 的 项 x 的 系数 是 奇数 ( 见 练习 1.4.41 )， 那 么 该 元 素 被 设置 为 true， 否 则 为 false。 你 
可 能 会 对 第 三 个 例子 形成 的 图 形 感到 惊讶 。 


2.4.2 ”为 Percolation 实现 一 个 print() 方法 ， 用 “1” 表 示 阻 塞 的 网 格 ,“0” 表 示 开 放 的 网 格 ,“*” 表 
示 连 通 的 网 格 。 
2.4.3 ”给 定 如 下 输入 ， 写 出 程序 2.4.5 中 flow0 的 递归 调用 过 程 : 
33 
101 
000 
110 
2.4.4 ”编写 一 个 Percolation 的 客户 程序 ， 这 个 客户 程序 命令 行 读 取 系统 模块 n 和 增 量 4， 对 于 nxXn 
的 随机 系统 ， 网 格 开放 概率 p 从 0 递增 到 1， 每 次 的 增 量 为 4， 进 行 一 系列 实验 并 用 类 似 
PercolationVisualizer 的 方式 展示 结果 。 
2.4.5” 在 没有 阻塞 网 格 的 系统 上 运行 Percolation 程序 时 ， 描 述 网 格 被 标记 为 连通 的 顺序 。 哪 个 是 最 后 
一 个 标记 的 网 格 ? 递归 的 深度 是 多 少 ? 
2.4.6 ”使 用 PercolationPlot 绘制 各 种 数学 函数 (将 PercolationProbability.estimate() 替换 为 相应 的 数学 
函数 的 估算 语句 ) 的 实验 。 尝 试 函 数 ftx)=sin x+cos 10x， 看 看 曲线 与 正弦 曲线 的 匹配 度 如 何 。 
试 着 用 这 个 方法 绘制 你 自己 选择 的 三 四 个 函数 曲线 。 
2.4.7 ”把 Percolation 程序 修改 成 动画 展示 方式 ， 逐 渐 显 示 网 格 被 逐个 填充 的 过 程 。 也 可 以 用 动画 展示 
上 一 题 中 函数 逐渐 拟 合 的 过 程 。 
2.4.8 ”修改 Percolation 程序 以 计算 求解 过 程 中 出 现 的 最 大 递归 深度 。 绘 制 该 值 与 网 格 开 放 概率 的 函 
数 关系 图 。 如 果 反 转 递归 调用 的 顺序 ， 你 的 答案 如 何 改变 ? 
2.4.9 修改 PercolationProbability 以 产生 类 似 于 Bernoulli (程序 2.2.6) 所 产生 的 输出 。 附 加 : 使 用 你 
的 程序 来 验证 数据 服从 高 斯 分 布 的 假设 。 
2.4:10 创建 一 个 程序 PercolationDirected 测试 定向 渗透 (通过 在 程序 2.4.5 的 递归 版 flow() 方法 中 放 
弃 最 后 一 个 递归 调用 ， 如 文中 所 述 )， 然 后 使 用 PercolationPlot 绘制 一 个 定向 渗透 概率 作为 网 
格 开放 概率 p 的 函数 曲线 。 
2.4.11 写 一 个 Percolation 和 PercolationDirected 的 客户 程序 ， 从 命令 行 中 获取 一 个 网 格 开放 概率 p， 
并 打印 出 系统 渗透 但 是 不 向 下 定向 渗透 的 概率 。 使 用 足够 的 实验 来 保证 得 到 的 估计 值 精确 到 
小 数 点 后 三 位 。 
创新 练习 
2.4.12” 重 直 渗 透 。 证 明 一 个 网 格 开放 概率 为 p 的 系统 垂直 渗透 概率 为 1-(1-p")”， 并 使 用 Percolation- 
Probability 程序 验证 不 同 的 n 值 的 情况 。 
2.4.13” 适 形 渗透 系 统 。 修 改 本 节 中 的 代码 ， 以 支持 在 矩形 系统 中 研究 渗透 。 比 较 宽 高 比 为 2:1 和 1:2 


的 系统 的 渗透 概率 。 


2.4.14 


2.4.15 


2.4.16 


2.4.17 


2.4.18 


2.4.19 


2.4.20 
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适应 性 绘图 。 修 改 PercolationPlot， 将 其 控制 参数 (间隙 容 限 、 误 差 容 限 和 试验 次 数 ) 作为 命 
令 行 参数 。 试 验 各 种 参数 值 ， 以 了 解 它 们 对 曲线 质量 和 计算 成 本 的 影响 。 简 要 描述 你 的 发 现 。 
非 递归 实现 的 定向 渗透 。 编 写 一 个 非 递 归程 序 ， 在 代码 中 通过 从 上 到 下 移动 来 测试 定向 渗透 。 
你 的 解决 方案 可 以 基于 以 下 计算 方法 : 如 果 在 当前 行 中 由 开放 网 格 组 成 的 连续 子 行 中 ， 有 任 
何 网 格 连 接 到 前 一 行 上 的 某 个 连通 网 格 ， 则 这 个 子 行 中 的 所 有 网 格 都 可 以 标识 为 连通 的 。 
经 由 一 条 连通 网 格 的 路 径 连接 到 项 层 ， 
并 且 路 径 中 没有 向 上 行走 的 部 分 


A 





RN 地 


没有 上 述 路 径 连接 到 顶层 
可 以 连接 到 顶层 


定向 渗透 的 计算 过 程 


快速 渗透 测试 。 修 改 程序 2.4.5 中 的 递归 flow() 方法 ， 在 找到 底 行 的 一 个 连通 网 格 后 立即 返回 
(并 且 不 再 继续 填充 其 他 网 格 )。 提 示 : 使 用 一 个 参数 ， 如 果 底 部 被 击 中 ， 则 返回 true， 否 则 返 
回 false。 在 运行 PercolationPlot 时 ， 粗 略 估计 此 更 改 带 来 的 性 能 改进 。 使 用 需要 至 少 运行 几 
秒 但 不 超过 几 分 钟 的 n 值 。 请 注意 ， 除 非 flow0 中 的 第 一 个 递归 调用 是 针对 当前 网 格 正 下 方 
的 网 格 ， 否 则 这 种 改进 是 无 效 的 。 

键 渗透 ( Bond percolation)。 假 设 网 格 的 边缘 之 间 是 可 以 连通 的 ， 编 写 一 个 模块 化 渗透 
的 程序 研究 这 种 情况 下 的 渗透 。 也 就 是 说 ， 边 缘 可 以 是 空 的 也 可 以 是 连通 的 , 并 “上 电 北 
且 如 果 存 在 由 从 上 到 下 的 连通 边缘 组 成 的 路 径 ， 则 系统 渗透 。 注 意 : 这 个 问题 已 ”三 

经 通过 理论 分 析 解 决 了 ， 所 以 你 的 模拟 实验 应 该 验证 分 析 的 结论 ， 即 ， 当 nn 足够 


大 时 ， 键 渗透 的 阐 值 接近 1/2。 | 
三 维 渗透 。 实 现 类 Percolation3D 和 BooleanMatrix3D (用 于 I/O 和 随机 生成 ) 来 研 

究 三 维 立 方 体 的 渗透 ， 以 推广 本 节 研 究 的 二 维 情 况 。 渗 透 系 统 是 由 单位 立方 体 组 
成 的 nXnXn 立方 体 ， 每 个 立方 体 以 概率 p 开放 并 以 概率 1-p 阻塞 。 当 两 个 开放 的 立方 体 有 
任何 一 个 面相 邻 时 (六 个 相 邻 面 之 一 ， 除 了 边界 上 )， 渗 透 的 路 径 都 可 以 把 它们 连接 起 来 。 如 
果 存 在 将 底部 平面 上 的 任何 开放 的 网 格 连接 到 顶部 平面 上 的 任何 开放 的 网 格 的 路 径 ， 则 该 系 
统 渗透 。 使 用 递归 版 本 的 flow() (如 程序 2.4.5 )， 但 这 次 需要 使 用 8 个 递归 调用 而 不 是 4 个 。 
将 渗透 概率 与 网 格 开放 概率 p 绘制 成 函数 曲线 ， 选 择 尽 可 能 大 的 值 n。 如 本 节 所 强调 的 那样 ， 
务必 逐步 开发 你 的 解决 方案 。 

三 角形 网 格 上 的 键 渗透 。 写 一 个 模块 化 的 程序 ， 用 于 研究 三 角形 网 格 上 的 键 渗 渗透 
透 ， 其 中 系统 由 2m 个 等 边 三 角形 组 合成 nXn 的 萎 形 网 格 。 每 个 内 部 点 有 六 CACGLCY 
条 边 ; 边 上 的 每 个 点 有 四 条 边 ; 每 个 角 点 有 两 条 边 。 3 
生命 的 游戏 。 编 写 一 个 类 GameOfLife 用 于 模拟 康 威 的 生命 游戏 ( Conway’s 
Game of Life)。 我 们 用 一 个 布尔 矩阵 来 模拟 这 个 系统 ， 和 矩阵 中 的 每 一 个 元 素 SN 
对 应 于 系统 的 一 个 单元 ， 它 的 状态 可 能 是 活 的 或 者 是 死 的 。 游 戏 的 过 程 中 需 ee 
要 检查 和 更 新 每 个 单元 格 的 值 。 每 个 单元 格 的 值 取 决 于 它 的 邻居 (每 个 方向 上 一 

的 相 邻 单元 格 以 及 对 角 线 上 的 单元 格 ) 的 值 。 在 整个 游戏 的 过 程 中 ， 单 元 格 的 状态 只 能 够 按照 


无 法 渗透 
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以 下 条 件 发 生变 化 ， 其 他 状况 下 均 保持 原状 态 不 变 : 
。 如 果 一 个 死 的 单元 格 有 且 仅 有 三 个 活着 的 邻居 ， 那 么 死 的 单元 格 会 复活 。 
。 如 果 一 个 单元 格 有 且 仅 有 一 个 活着 的 邻居 ， 那 么 这 个 单元 格 会 死 掉 。 
。 如 果 一 个 单元 格 有 三 个 以 上 活着 的 邻居 ， 那 么 这 个 单元 格 会 死 掉 。 

系统 的 初始 状态 是 一 个 随机 的 布尔 矩阵 ， 或 者 使 用 本 书 官网 上 的 任意 一 种 模型 作为 初始 
状态 ， 运 行 你 的 实验 并 查看 最 终结 果 。 这 个 游戏 已 被 深入 研究 ， 从 原理 层面 涉及 计算 机 科学 
的 基础 (参见 本 书 官网 获取 更 多 信息 )。 
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面 问 对 象 编程 





学 习 高 效 编程 的 过 程 从 理论 上 讲 非 常 简单 。 到 目前 为 止 ， 我 们 已 经 学 习 了 如 何 使 用 内 置 
数据 类 型 ， 接 下 来 将 在 本 章 学 习 如 何 使 用 、 创 建 和 设计 更 高 级 的 数据 类 型 。 

抽象 是 某 种 事物 的 简化 描述 ， 抓 住 事物 本 质 的 同时 忽略 所 有 其 他 细节 。 在 科学 、 工 程 和 
编程 领域 ， 人 们 一 直 努 力 地 通过 抽象 的 方法 来 理解 复杂 的 系统 。 在 Java 程序 设计 中 ， 使 用 
的 是 面向 对 象 程 序 设 计 (object-oriented programming ) 方法 ， 即 将 一 个 庞大 而 复杂 的 程序 分 
解 为 一 组 交互 的 元 素 或 对 象 。 面 向 对 象 的 程序 设计 的 思想 源 于 〈 在 软件 中 ) 对 真实 世界 的 实 
体 (如 电子 、 人 、 建 筑 物 或 太阳 系 等 ) 进行 建 模 的 方法 ， 并 且 逐 渐 拓 展 到 对 二 进 制 位 、 数 字 、 
颜色 、 图 像 或 程序 等 抽象 实体 进行 建 模 。 

一 个 数据 类 型 是 一 组 值 和 定义 在 这 些 值 上 的 一 系列 操作 。 在 Java 语言 中 ， 许 多 内 置 数 
据 类 型 (如 int、float 类 型 ) 的 取 值 范围 和 操作 是 预先 定义 好 的 。 在 面向 对 象 的 程序 设计 中 ， 
我 们 通过 编写 Java 代码 定义 新 的 数据 类 型 。 一 个 对 象 是 一 个 保存 某 种 数据 类 型 值 的 实体 ; 
你 可 以 通过 调用 此 数据 类 型 的 方法 来 操作 此 对 象 。 

这 种 定义 新 的 数据 类 型 并 处 理 保存 数据 类 型 值 的 对 象 的 能 力也 称 为 数据 抽象 ( data 
abstraction)。 数 据 抽象 引导 我 们 采用 模块 化 程序 设计 风格 ,这 自然 地 拓展 了 面向 过 程 程序 设 
计 风 格 ， 而 后 者 则 是 第 2 章 的 基础 。 数 据 类 型 允许 我 们 将 数据 及 数据 上 的 函数 操作 分 离 。 本 
章 我 们 遵循 的 程序 设计 理念 是 : 在 计算 中 应 当 清 晰 地 分 离 数据 和 相关 的 计算 任务 。 


3.3 ed 


织 数据 以 备 进 一 步 处理 是 计算 机 程序 开发 的 重要 步 又。 在 使 用 Java 语言 进行 程序 设 
计时 ， ER 在 Java pid 旨 在 支持 
面向 对 象 编程 ， 这 是 一 种 便于 组 织 和 处 理 数 据 的 编程 风格 。 

在 Java 语言 中 , 我们 有 8 种 基本 数据 类 型 (boolean、byte, char、double、float、int、 
long、 和 short) 可 供 使 用 ， 除 此 之 外 ， 还 有 大 量 的 引用 类 型 以 及 配套 的 库 作 为 补充 ， 这 些 
引用 类 型 为 大 量 的 应 用 程序 量 身 定制 。 我 们 使 用 过 的 String 数据 类 型 就 是 这 样 一 个 例子 。 
本 节 将 学 习 有 关 String 数据 类 型 的 更 多 信息 ， 以 及 如 何 使 用 其 他 几 种 引用 类 型 来 进行 图 
像 处 理 和 输入 输出 。 这 些 引 用 类 型 中 有 些 内 置 在 Java 中 (String 和 Color)， 有 些 是 基于 
本 书 (In、Out、Draw 和 Picture) 开发 的 ， 这 些 后 开发 的 数据 类 型 作为 通用 资源 具有 重要 
的 作用 。 

我 们 很 容易 注意 到 ， 本 书 前 两 章 中 的 程序 主要 局 限于 数字 操作 。 这 是 必然 的 ， 原 因 是 
Java 的 基本 类 型 只 能 表示 数字 。String 类 型 是 一 个 例外 ， 这 是 一 种 内 置 在 Java 中 的 引用 类 
型 。 使 用 引用 类 型 后 ,我 们 编写 的 程序 不 仅 可 以 处 理 字符 串 ， 还 可 以 处 理 图 像 、 声 音 或 者 
Java 库 和 本 书 网 站 上 提供 的 数 百 种 其 他 抽象 数据 类 型 。 在 本 节 中 ， 我 们 重点 关注 使 用 现 有 数 
据 类 型 的 客户 程序 ， 从 而 为 读者 提供 理解 这 些 新 概念 的 具体 实例 以 作为 参考 ， 并 闸 述 其 应 用 
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范围 。 我 们 将 讨论 处 理 字符 串 、 颜 色 、 图 像 、 文 件 和 Web 页 面 的 程序 ， 本 节 涉 及 的 内 容 与 
第 1 章 基 于 基本 类 型 的 程序 设计 相 比 是 一 次 大 的 飞跃 。 

在 3:2 节 ， 我 们 将 学 习 如 何 定义 自己 的 数据 类 型 以 实现 抽象 ， 从 而 实现 另 一 个 飞跃 ， 进 
入 全 新 的 编程 世界 。 编 写 基 于 自 定 义 数 据 类 型 的 程序 是 一 个 非常 强大 和 有 用 的 程序 设计 风 
格 ， 这 种 风格 多 年 来 一 直 主 导 着 整个 编程 领域 。 

基本 定义 ”数据 类 型 是 一 组 值 的 集合 和 定义 在 这 些 值 上 的 一 组 操作 的 集合 。 这 人 句 话 很 
重要 ， 它 是 我 们 反复 强调 的 几 个 观点 之 一 。 在 第 1 章 ， 我 们 详细 讨论 了 Java 内 置 数据 类 型 。 
例如 ， 基 本 数据 类 型 int 是 -2” 到 2 -1 之 间 的 整数 ; 定义 在 int 数 据 类 型 上 的 操作 包含 基本 
算术 和 比较 操作 ， 如 + 时 %、< 和 >。 

我 们 也 使 用 过 非 内 置 数 据 类 型 String 类 型 。String 数据 类 型 的 值 是 字符 序列 ， 可 以 
执行 连接 操作 ， 这 个 操作 需要 输入 两 个 字符 串 作 为 参数 ， 并 返回 一 个 字符 串 当 作 结果 。 在 本 
节 中 ,我 们 将 了 解 到 用 于 处 理 字符 串 的 其 他 几 十 个 操作 ， 如 查找 字符 串 长 度 、 从 字符 串 中 提 
取 单 个 字符 以 及 比较 两 个 字符 串 等 。 

每 种 数据 类 型 都 是 一 组 值 和 定义 在 这 些 值 上 的 一 组 操作 的 集合 ， 但 是 当 我 们 使 用 数据 类 
型 时 ,我 们 重点 关注 操作 ， 而 不 是 值 。 当 编 写 程序 使 用 int 或 double 类 型 的 值 时 ， 我 们 不 关 
心 这 些 值 在 内 存 中 是 如 何 存储 的 (我 们 从 来 没有 详细 说 明 这 些 细节 )); 在 编写 引用 类 型 的 程 
序 时 也 是 如 些 ， 如 String、Color 或 Picture。 换 句 话 说 ， 使 用 一 个 数据 类 型 时 无 须 理 解 其 具 
体 实现 (这 是 本 书 将 反复 强调 的 男 一 个 程序 设计 理念 )。 

String 数据 类 型 。 我 们 将 在 面向 对 象 程序 设计 的 上 下 文中 重新 学 习 Java 的 String 数据 
类 型 。 这 样 做 有 两 个 原因 。 首先 ， 从 第 一 个 程序 开始 就 一 直 使 用 String 数据 类 型 ， 对 我 们 来 
说 这 是 一 个 熟悉 的 例子 。 其次， 字符 串 处 理 是 很 多 计算 应 用 程序 的 关键 。 字 符 串 是 编译 和 执 
行 Java 程序 以 及 执行 其 他 许多 关键 计算 的 核心 。 它 们 也 是 信息 处 理 系统 的 基础 ， 对 于 许多 
商业 系统 至 关 重 要 。 日 常生 活 中 人 们 使 用 字符 串 撰写 邮件 、 博 客 ， 进 行 聊天 或 准备 发 布 的 文 
档 。 字 符 串 也 是 多 个 科学 发 展 领域 的 重要 组 成 部 分 ， 特 别 是 分 子 生 物 学 。 

我 们 编写 程序 声明 、 创 建 和 操作 String 类 型 的 值 。 我 们 首先 描述 String 类 型 的 API, 它 
描述 了 编程 中 可 用 的 若干 操作 。 接 下 来 ， 我 们 使 用 Java 语言 机 制 来 声明 变量 ， 创 建 对 象 来 
保存 数据 类 型 的 值 并 调用 实例 方法 来 应 用 这 些 数据 类 型 的 操作 。 这 些 功能 与 内 置 数 据 类 型 的 
操作 有 所 不 同 ; 但 是 你 也 很 容易 注意 到 它们 的 相似 之 处 。 

API。Java 类 提供 了 定义 数据 类 型 的 功能 。 在 一 个 类 中 ， 我们 指定 数据 类 型 的 值 并 实现 
数据 类 型 上 的 操作 。 依 旧 遵 循 我 们 的 程序 设计 理念 ， 即 使 用 一 个 数据 类 型 时 无 须 理 解 其 具体 
实现 ， 因 此 ,， 通 过 在 API (应 用 程序 编程 接口 ) 中 列 出 数据 实例 可 以 使 用 的 方法 ， 从 而 指定 
客户 程序 可 以 发 起 的 行为 ， 如 同 在 静态 方法 中 所 做 的 一 样 。API 的 目的 是 给 基于 该 数据 类 型 
编写 的 客户 程序 提供 信息 。 

下 表 总 结 了 Java 中 String 数据 类 型 的 API 中 最 经 常 使 用 的 实例 方法 ; 而 完整 的 API 有 
60 多 个 方法 ! 以 下 几 个 方法 使 用 整数 作为 字符 串 中 字符 的 索引 ; 与 数组 一 样 ， 这 些 索 引 的 
起 始 位 置 是 从 0 开始 的 。 

第 一 个 方法 名 与 类 名 相同 ， 且 没有 返回 值 ， 这 是 在 定义 一 个 特殊 方法 ， 称 为 构造 函数 。 
其 余 的 条 目 定义 了 实例 方法 ， 这 些 实例 方法 和 我 们 早已 使 用 过 的 静态 方法 一 样 接 受 参数 和 
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返回 值 ， 但 是 它们 不 同 于 静态 方法 : 实例 方法 实现 了 对 数据 类 型 的 操作 。 例 如 ,实例 方法 
length() 返回 了 字符 串 中 的 字符 个 数 ， 而 charAt() 返回 指定 位 置 的 字符 。 


public class String (Java String 数 据 类 型 ) 





int 
char 
String 
boolean 
boolean 
boolean 
int 

int 


String 
int 
String 
String 
String 
String[] 
boolean 
int 


String(String s) 

length() 

charAt(int i) 

substring(int i, int j) 
contains(String substring) 
startsWith(String pre) 
endsWith(String post) 
indexOf(String pattern) 
indexOf(String pattern, int i) 


concat(String +t) 
compareTo(String t) 
toLowerCase() 

toUpperCase() 
replaceAll(String a, String b) 
split(String delimiter) 
equals(Object t) 

hashCode() 


有 关 其 他 许多 可 用 方法 请 参考 在 线 文档 或 本 书 官 网 
Java 的 String 数据 类 型 的 API (部 分 内 容 ) 


声明 变量 。 声 明 引 用 数据 类 型 变量 的 方式 与 声明 内 置 数据 类 型 变量 的 方式 完全 相同 ， 声 
明 语句 都 是 数据 类 型 名 称 后 跟 变 量 名 称 。 例 如 下 面 这 行 语句 : 


String s; 


创建 一 个 与 s 值 相同 的 字符 串 
字符 的 个 数 

索引 下 标 为 i 的 字符 

索引 下 标 从 i 到 j-1 之 间 的 字符 串 
此 字符 串 是 否 包 含 substring? 
此 字符 串 是 否 以 pre 开 头 ? 

此 字符 囊 是 否 以 post 结 尾 ? 

第 一 次 出 现 pattern 的 位 置 索 引 
在 索引 位 置 之 后 第 一 次 出 现 
的 pattern 的 索引 下 标 

此 字符 串 后 添加 t 

字符 串 比较 

此 字符 串 的 小 写字 母 形式 

此 字符 串 的 大 写字 母 形式 

此 字符 串 中 的 a 用 b 来 替换 

字符 串 被 delimiter 分 割 后 的 子 字 符 串 组 
此 字符 串 的 值 是 否 与 的 值 相同 
整数 的 散 列 码 


作用 是 声明 String 类 型 的 变量 s。 此 语句 不 会 创建 任何 东西 ,仅仅 是 通知 系统 将 会 使 用 变量 
s 来 引用 String 类 型 的 变量 。 为 了 编程 风格 统一 ， 习 惯 上 引用 数据 类 型 以 大 写字 母 开 头 ， 内 
置 数据 类 型 以 小 写字 母 开 头 。 

创建 对 象 。 在 Java 中 ， 每 个 数据 类 型 的 值 都 存储 


在 一 个 对 象 中 。 要 创建 (或 实例 化 ) 一 个 数据 类 型 的 对 
象 (或 实例 )， 可 调用 构造 函数 指示 Java 创建 一 个 对 象 。 
Java 调用 构造 函数 时 ， 使 用 关键 字 new 后 跟 类 名 ， 并且 
指定 构造 函数 的 参数 。 构 造 函 数 的 参数 在 括号 中 ， 并 通 
过 逗号 分 隔 ,这 与 静态 方法 是 一 样 的 。 例 如 ，new String 
("Hello,World") 创建 一 个 新 的 String 类 型 对 象 ， 该 对 象 


声明 变量 ( 对 象 名 称 ) 


/ 调用 构造 函数 
来 创建 一 个 对 象 
String s; 





Ce =[new String("Hello, World")|; 
char c =|[S].charAt(4) | ; 


对 象 名 称 0 
象 值 的 实例 方法 
使 用 引用 数据 类 型 


表示 的 字符 序列 是 “ Hello,World”。 通 常情 况 下 ， 通 过 调 
用 构造 函数 来 创建 一 个 新 对 象 的 同时 ， 还 在 同一 行 代码 中 
声明 一 个 变量 用 来 引用 该 对 象 : 
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String s = new String("Hello, World"); 


你 可 以 创建 任意 数量 的 相同 数据 类 型 对 象 的 对 象 ， 每 个 对 象 都 应 有 其 独立 的 标识 ， 两 个 





相同 类 型 的 对 象 存储 的 值 可 能 相同 也 可 能 不 同 。 例 如 ,代码 


String sl = new String("Cat"); 

String s2 = new String("Dog"); 

String s3 = new String("Cat"); 
创建 了 三 个 不 同 的 字符 串 对 象 。 尽 管 sl 和 s3 有 相同 的 字符 序列 ， 但 是 它们 并 不 是 同一 个 
对 象 。 

调用 实例 方法 。 引 用 数据 类 型 的 变量 和 内 置 数据 类 型 变量 之 间 最 大 的 区 别 是 ， 使 用 引 
用 数据 类 型 变量 可 以 调用 为 这 个 数据 类 型 上 的 操作 而 专门 定义 的 方法 (与 用 于 内 置 数据 类 型 
的 操作 (如 + 和 *) 不 同 )。 这 类 方法 我 们 称 为 实例 方法 (instance method)。 调 用 一 个 实例 
方法 ， 与 在 另 一 个 类 中 调用 静态 方法 类 似 。 只 是 实例 方法 不 仅 与 类 相关 而 且 还 与 单独 对 象 
相关 ， 因此， 通常 使 用 对 象 名 (给 定 类 型 的 变量 ) 而 不 是 类 名 来 调用 方法 。 例 如 ， 如 果 sl 
和 s2 是 定义 的 String 类 型 的 变量 ， 那 么 sl.length() 返回 整数 3、sl.charAt(1) 返回 字符 'a'、 
sl.concat(s2) 返回 一 个 新 字符 串 "CatDog"。 

String a = new StringC now is"); 


String b = new String("the time"); 
String c = new String(" the"); 


实例 方法 的 调用 。 返回 值 类 型 返回 值 





a.length() int 6 
a.charAt(4) char I 
a.substring(2, 5) String J 
b.startswith("the") boolean true 
a.indexOf("is") int 4 
a.concat(c) String "now is the” 
b.replace("t", "T") String "The Time" 


SPI -区 Stringf] tnows 1s" 于 
b.equals(c) boolean false 


String 数据 类 型 的 操作 示例 


String 类 的 快捷 方法 。Java 语言 为 String 数据 类 型 提供 了 专门 的 支持 ， 有 些 你 已 经 使 用 
过 ， 如 可 以 使 用 字符 串 文本 而 无 须 调用 构造 函数 来 创建 String 对 象 。 此 外 ， 也 可 以 通过 拼接 
操作 符 (+) 而 无 须 调用 concat() 方法 来 拼接 两 个 字符 串 。 在 这 里 ， 单 独 介绍 完整 版 方法 的 调 
用 模式 只 是 为 了 演示 语法 规则 。 这 两 个 快捷 方法 只 适用 于 String 数据 类 型 ， 你 在 其 他 数据 类 
型 里 必须 使 用 调用 模式 。 

快捷 版 String s = "abc"; Stringt =r+s; 

完整 版 String s = new String("abc"); String t = r.concat(s); 

以 下 代码 片段 说 明了 各 种 字符 串 处 理 方法 的 使 用 。 这 些 代码 清楚 地 展示 了 开发 一 个 抽象 
模型 的 思想 ， 并 将 抽象 代码 的 实现 与 代码 的 使 用 相 分 离 。 这 个 能 力 是 面向 对 象 程序 设计 的 特 
征 ， 也 是 本 书 的 一 个 转折 点 : 虽然 我 们 还 没有 看 到 按照 这 个 规则 实现 的 代码 ， 但 是 从 现在 开 
始 ， 本 书 编写 的 所 有 代码 的 风格 都 将 是 以 数据 类 型 为 中 心 ， 为 了 实现 数据 类 型 的 某 个 操作 而 
定义 和 调用 方法 。 
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String s = args[0]; 

int dot = s.indexOf("."); 

String base = s.substring(0, dot); 

String extension = s.substring(dot + 1, s.length()); 


从 命令 行 参数 中 
提取 文件 名 和 扩展 名 





String query = args[0]; 
while (StdIn.hasNextLine()) 
{ 
String line = StdIn.readLine(); 
if (line.contains(query)) 
stdout .print1in(1ine); 


打印 标准 输入 中 包含 
命令 行 参数 的 所 有 字符 串 





public static boolean isPalindrome(String s) 
€ 
intn= s.1length(); 
for (int i = 0; i < n/2; i++) 
if (s.charAt(i) != s.charAt(n—1-i)) 
return false; 
return true; 


字符 串 是 否 为 回 文 


} 


public static String translate(String dna) 
{ 
dna = dna.toUpperCase(); 
String rna = dna.replaceAl1("T", "U"); 
return rna; 
} 


典型 的 字符 串 处 理 代码 


将 DNA 转译 为 mRNA 
(用 品 来 替换 T) 


字符 串 处 理应 用 : 基因 组 学 ”为 了 获得 更 多 的 字符 串 处 理 经 验 ， 我 们 将 对 基因 组 学 领 
域 做 一 个 简单 的 介绍 ， 并 讨论 一 个 程序 ， 生 物 信息 学 家 可 以 使 用 该 程序 发 现 潜 在 的 基因 。 生 
物 学 家 使 用 一 个 简单 的 模型 来 表示 生命 的 构造 : 字母 A、C、T 和 GG 分别 代表 生命 体 DNA 
中 的 四 个 碱 基 。 在 每 个 生命 体 中 ， 这 些 基 本 构成 部 分 组 成 一 个 很 长 的 序列 ， 称 为 基因 组 (每 
个 染色 体 就 是 一 个 序列 )。 理 解 基因 组 的 特性 是 理解 其 在 生命 体 中 自身 表现 过 程 的 关键 。 许 
多 已 知 生物 的 基因 组 序列 (包括 人 类 基因 组 ), 约 由 30 亿 个 碱 基 构 成 ;自从 该 序列 被 确定 以 
后 ,科学 家 们 已 经 开始 编写 计算 机 程序 来 研究 它们 的 结构 。 字 符 串 处 理 是 现在 分 子 生物 学 中 
最 重要 的 方法 之 一 ， 它 使 得 研究 过 程 具备 实验 性 和 可 计算 性 。 

基因 预测 。 基 因 是 基因 组 的 一 个 子囊 ， 是 理解 生命 过 程 至 关 重 要 的 功能 单元 。 基 因由 一 
系列 的 密码 子 组 成 ， 每 个 密码 子 是 由 一 系列 氨基 酸 组 成 氨基酸 是 由 三 个 碱 基 组 成 的 序列 。 
起 始 密码 子 ATG 标记 基因 的 开始 ， 任 何 终 止 密码 子 TAG、TAA 或 TGA 标记 基因 的 终止 ( 基 
因 的 其 他 位 置 不 允许 出 现 这 些 终 止 密码 子 )。 分 析 基 因 组 的 第 一 步 就 是 找到 它 的 潜在 基因 ， 
这 是 一 个 字符 串 的 处 理 问题 ， 可 使 用 Java 的 String 数据 类 型 解决 。 

PotentialGene 程序 (程序 3.1.1 ) 是 基因 数据 处 理 的 第 一 步 。isPotentialGene() 函数 接收 
一 个 DNA 序列 作为 参数 ,并 根据 以 下 标准 确定 它 是 否 对 应 一 个 潜在 基因 : 基因 长 度 是 3 的 
倍数 ， 以 起 始 密 码 子 开始 ， 以 终止 密码 子 结束 ， 并 且 在 中 间 没 有 其 他 终止 密码 子 。 为 了 做 
出 判断 ， 程 序 使 用 了 各 种 字符 串 的 实例 方法 : length()、charAt()、startsWith()、endsWith()、 
substring() 和 equals()。 
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程序 3.1.1 识别 潜在 基因 


public class PotentialGene 






public static boolean isPotentialGene(String dna) 







1/ 长 度 是 3 的 倍数 
if (dna.length() % 3 != 0) return false; 


// 以 起 始 密 码 子 开始 
if (I!dna.startsWith("ATG")) return false; 


1// 没有 终止 密码 子 介入 
for (int 1 = 3; i < dna.length() - 3; i++) 












PE dna | 待 分 析 的 字符 串 
撕 (i % 3 == 0) codon | 三 个 连续 的 碱 基 


String codon = dna.substring(i, i+3); 









if (codon.equals("TAA")) return false; 
if (codon.equals("TAG")) return false; 
if (codon.equals("TGA")) return false; 





} 
} 
1 以 终止 密码 子 结束 
if (dna.endsWith("TAA")) return true; 
if (dna.endsWith("TAG")) return true; 
if (dna.endsWith("TGA")) return true; 








return false; 


$ 






} 







isPotentialGene() 函数 以 DNA 序 列 作 为 参数 ， 并 确定 它 是 否 对 应 一 个 潜在 
基因 : 长 度 是 3 的 倍数 ， 以 起 始 密码 子 开始 ( ATG ) ， 以 终止 密码 子 结束 (TAA、 
TAG 或 TGA ) ， 并 且 其 中 没有 其 他 终止 密码 子 。 详 细 内 容 请 见 练习 3.119 的 测 
试用 客户 程序 。 









% java PotentialGene ATGCGCCTGCGTCTGTACTAG 
true 


% java PotentialGene ATGCGCTGCGTCTGTACTAG 
false 








尽管 定义 基因 的 规则 比 我 们 描述 的 要 复杂 一 点 ,但 是 程序 PotentialGene 演示 了 程序 设 
计 基 本 知识 是 如 何 帮 助 科学 家 更 有 效 地 研究 基因 序列 的 。 

在 目前 情况 下 ， 我 们 借助 String 数据 类 型 展示 的 是 定义 数据 类 型 的 作用 ， 即 将 一 个 重要 
的 抽象 进行 良好 的 封装 ， 并 向 客户 程序 提供 有 用 的 功能 和 方法 。 在 继续 讨论 其 他 例子 之 前 ， 
我 们 讨论 一 下 Java 中 引用 类 型 和 对 象 的 一 些 基 本 属性 。 

对 象 引 用 。 构 造 函 数 创 建 一 个 对 象 ， 并 返回 用 户 一 个 该 对 象 的 引用 ， 而 不 是 对 象 本 身 
(因此 命名 为 引用 类 型 )。 什 么 是 对 象 的 引用 ?这 其 实 是 一 种 访问 对 象 的 机 制 。Java 语言 中 有 
几 种 不 同 的 方式 来 实现 引用 ， 但 我 们 不 需要 知道 具体 细节 。 不 过 ， 应 该 在 原理 上 知道 一 个 通 
用 的 实现 方法 。 一 种 容易 理解 的 方法 是 ， 使 用 new 分 配 内 存 空 间 来 保存 对 象 的 数据 值 ， 并 
返回 一 个 指向 该 空间 的 指针 (内 存 地 址 )。 此 时 ， 保 存 这 个 对 象 的 内 存 地 址 也 被 称 为 对 象 的 
标识 (identity)。 

为 什么 不 直接 处 理 对 象 本 身 呢 ? 对 于 一 个 小 对 象 ， 这 样 做 可 能 是 可 行 的 ;而 对 大 的 对 象 
来 说 ， 开 销 会 成 为 问题 : 数据 类 型 值 可 能 消耗 大 量 的 内 存 。 每 次 将 对 象 作 为 参数 传递 给 方法 
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时 ,复制 或 移动 所 有 的 数据 是 没有 意义 的 。 这 个 思路 看 起 来 很 熟悉 ， 我 们 之 前 在 2.1 节 中 将 
数组 作为 参数 传递 给 静态 方法 时 ， 就 采用 了 相同 的 思考 方式 。 事实 上 ， 数 组 就 是 对 象 ， 我 们 
将 在 本 节 后 面 看 到 。 相 比 之 下 ， 内 置 数据 类 型 的 值 是 直接 在 内 存 中 存储 的 ， 所 以 不 必 使 用 引 


用 类 型 的 方式 去 访问 每 一 个 值 。 


在 看 过 几 个 使 用 了 引用 类 型 的 客户 代码 后 ， 我 们 将 更 详细 地 讨论 对 象 引 用 的 属性 。 
使 用 对 象 。 变 量 声明 提供 了 一 个 对 象 的 变量 名 称 ， 我 们 可 以 在 代码 中 使 用 变量 名 称 ， 方 


法 与 使 用 int 或 者 double 类 型 的 变量 名 一 样 。 

。 作为 方法 的 参数 或 返回 值 

。 在 赋值 语句 中 

。 在 数组 中 

从 HelloWorld 程序 以 来 ， 我 们 一 直通 过 这 种 方式 使 用 字符 串 
对 象 : 大 多 数 程序 使 用 字符 串 作为 参数 调用 StdOut.println0 ; 所 
有 程序 都 有 一 个 main( 方法 ，main() 的 参数 就 是 一 个 字符 串 类 型 
数组 。 除 了 上 面 这 些 功能 以 外 ， 引 用 对 象 的 变量 还 有 一 个 额外 的 
重要 功能 : 调用 一 个 在 引用 类 型 上 定义 的 实例 方法 。 

此 用 法 不 适用 于 内 置 数据 类 型 的 变量 ， 因 为 内 置 数据 类 型 
的 操作 是 内 置 在 语言 中 的 ， 只 能 通过 操作 符 (如 +、-、* 和 1/) 
调用 。 

未 初始 化 的 变量 。 当 声明 一 个 引用 类 型 的 变量 但 并 未 赋值 时 ， 
这 个 变量 就 处 于 未 初始 化 (uninitialized) 状态 。 这 时 ， 当 你 试图 
使 用 这 个 变量 的 时 候 ， 会 产生 与 内 置 数据 类 型 同样 的 问题 。 例 如 ， 


String bad; 

boolean value = bad.startsWith("Hello"); 
代码 会 导致 编译 时 错误 :“variable bad might not have been initialized” 
(变量 bad 可 能 没有 初始 化 )， 因 为 程序 尝试 使 用 一 个 未 初始 化 
的 变量 。 

类 型 转换 。 如 果 要 将 对 象 从 一 种 数据 类 型 转换 为 男 一 种 ， 必 
须 编写 代码 来 完成 。 通 常情 况 下 不 存在 这 个 问题 ， 因 为 不 同 的 
数据 类 型 具有 不 同 的 值 , 无 法 转换 。 试 想 ， 把 一 个 String 对 象 
转换 为 一 个 Color 对 象 有 何 意义 呢 ? 但 有 一 个 重要 的 场景 下 这 种 
转换 是 值得 的 : Java 所 有 的 引用 类 型 都 有 一 个 特殊 的 实例 方法 
toString0， 这 个 实例 方法 返回 一 个 字符 串 对 象 。 转换 过 程 取决 于 
代码 的 实现 ， 程 序 员 可 以 随意 实现 该 方法 ,通常 情况 下 会 将 对 象 
的 值 进行 编码 并 转换 成 一 个 字符 串 对 象 。 通 常 ， 程 序 员 在 调试 代 
码 时 调用 toString() 方法 来 打印 跟踪 。 在 某 些 情况 下 ，Java 会 自 
动 调用 toString() 方法 ， 如 字符 串 连接 和 StdOut.println0)。 也 就 


一 个 对 象 


cl 的 标识 


c2 的 标识 





对 和 象 的 表示 


是 说 ， 对 于 任何 引用 类 型 的 对 象 x，Java 都 会 自动 将 表达 式 "x"+x 转换 到 "x="+x.toString()， 
表达 式 StdOut.println(x) 转换 为 StdOut.println(x.toString0)。 在 3.3 节 中 ,我 们 将 研究 实现 


此 功能 的 Java 语言 内 部 机 制 。 


访问 引用 数据 类 型 。 与 静态 方法 的 库 一 样 ， 实 现 每 个 类 的 代码 都 保存 在 一 个 与 该 类 同名 
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但 带 有 .java 扩展 名 的 文件 中 。 若 要 编写 一 个 使 用 引用 类 型 的 客户 程序 ， 须 使 Java 可 以 访问 
到 该 类 对 应 的 文件 。String 数据 类 型 是 Java 语言 的 一 部 分 ， 因 此 它 始终 可 用 。 通 过 将 .java 
文件 的 副本 放 在 与 客户 程序 相同 的 目录 中 ,或 者 使 用 Java 类 路 径 机 制 (在 本 书 官网 上 有 详 
细 描 述 ) 可 使 用 程序 员 自 定义 的 数据 类 型 。 了 解 这 个 之 后 ,我们 将 学 习 如 何在 客户 代码 中 使 
用 引用 数据 类 型 。 

实例 方法 和 静态 方法 的 区 别 。 最 后 ,我 们 需要 学 习 static 修饰 符 的 含义 ， 自 程序 1.1.1 
以 来 我 们 一 直 在 使 用 它 一 一 这 是 编写 Java 程序 中 最 后 神秘 细节 之 一 。 静 态 方法 的 主要 目的 
是 实现 函数 ; 实例 ( 非 静 态 ) 方法 的 主要 目的 是 实现 数据 类 型 的 操作 。 我 们 的 客户 代码 可 以 
区 分 两 种 方法 的 用 法 ， 因 为 静态 方法 的 调用 通常 以 类 名 开头 〈 按 惯例 大 写 )， 而 实例 方法 调 
用 通常 以 对 象 名 称 开头 ( 按 惯例 小 写 )。 这 些 差异 总 结 在 下 表 中 ， 在 编写 了 一 些 自己 的 代码 
之 后 ， 就 能 够 快速 识别 差异 了 。 


实例 方法 静态 方法 
调用 样 例 s.startsWith("He11o") Math.sqrt(2.0) 
调用 对 象 名 (或 对 象 引 用 ) 类 名 
参数 调用 方法 的 对 象 和 参数 参数 
主要 的 目的 操作 对 象 的 值 计算 返回 值 
实例 方法 与 静态 方法 


前 文 涉 及 的 基本 概念 是 面向 对 象 编程 的 基础 ， 所 以 这 里 非常 有 必要 做 一 下 总 结 。 数 据 类 
型 是 一 组 值 和 定义 在 这 组 值 上 的 一 系列 操作 的 集合 。 我 们 在 独立 模块 中 实现 了 数据 类 型 ， 并 
在 客户 程序 中 使 用 它们 。 对 象 是 数据 类 型 的 实例 。 一 个 对 象 的 特点 是 其 具有 三 个 基本 属性 : 状 
态 、 行 为 和 标识 。 状 态 是 对 象 当 前 表示 的 数据 类 型 的 值 ; 行为 由 其 数据 类 型 的 操作 定义 ; 对 
象 的 标识 是 其 在 内 存 中 的 存储 位 置 。 在 面向 对 象 程序 设计 中 ， 我 们 通过 调用 构造 函数 创建 对 
象 ， 然 后 通过 调用 对 象 的 实例 方法 修改 它 的 状态 。 在 Java 中 ,我 们 通过 对 象 引用 来 访问 对 象 。 

为 了 展示 面向 对 象 程序 设计 的 强大 能 力 ， 接 下 来 我 们 讨论 几 个 示例 。 首 先 ， 我 们 研究 熟 
知 的 图 像 处 理 世 界 的 问题 ， 编 程 来 处 理 Color 和 Picture 对 象 。 接 着 ， 我 们 从 面向 对 象 程序 
设计 的 角度 回顾 输入 输出 函数 库 ， 使 我 们 能 够 从 文件 和 Web 页 面 中 获取 信息 。 

颜色 颜色 是 由 电磁 辐射 引起 的 眼睛 的 感觉 。 因 为 在 计算 机 中 经 常 需要 查看 和 处 理 彩 色 
图 像 ， 所 以 颜色 是 计算 机 图 形 学 中 一 个 广泛 应 用 的 抽象 ，Java 为 此 提供 了 这 样 一 种 专门 的 数 
据 类 型 即 Color。 在 专业 出 版 、 印 刷 、Web 等 领域 ,处 理 颜 色 是 一 项 复杂 的 任务 。 例 如 ， 彩 
色 图 像 的 显示 效果 在 很 大 程度 上 取决 于 所 使 用 的 展示 介质 。Color 数据 类 型 将 创意 设计 师 确 
定 所 需要 颜色 的 问题 ， 转 变 为 计算 机 系统 忠实 地 呈现 所 需 颜色 的 问题 。 

Java 库 中 有 数 百 种 数据 类 型 ， 因 此 需要 明确 列 出 程序 中 使 用 了 哪些 Java 库 ， 以 避免 命 
名 冲突 。 特 别 地 ， 我 们 需要 在 使 用 Color 的 程序 的 开始 处 添加 如 下 声明 。 


import java-awt.Color; 


需要 说 明 的 是 ， 到 现在 为 止 ， 我 们 一 直 在 使 用 标准 的 Java 库 或 我 们 自己 编写 的 类 ， 所 
以 才 一 直 没 有 使 用 库 的 导入 功能 。 

Color 使 用 RGB 颜色 模型 表示 颜色 值 ， 即 一 种 颜色 由 三 个 整数 (每 个 取 值 范围 为 0 到 
255 ) 确定 ,分 别 表示 颜色 的 红 、 绿 、 蓝 (相应 ) 分 量 的 强度 。 其 他 颜色 值 是 通过 混合 红 、 
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绿 、 蓝 分 量 获 得 的 。 也 就 是 说 ，Color 的 数据 类 型 值 是 三 个 8 位 整数 。 我 们 不 需要 知道 整数 
是 使 用 int、short 还 是 char 值 来 表示 的 。 根 据 这 个 模型 ，Java 使 用 


24 位 来 表示 每 种 颜色 ， 可 以 表示 256`=2”* 完 1670 万 种 可 能 的 颜色 。 ,。。 


据 科学 家 估计 ， 人 类 肉眼 可 辨识 的 颜色 只 有 约 一 千 万 种 。 


red green 


Color 数据 类 型 包含 一 个 带 3 个 整数 参数 的 构造 函数 。 例 如 ， ， 
下 面 的 代码 创建 了 两 种 颜色 ， 一 种 是 纯 红 色 ， 男 一 种 是 用 来 印刷 本 100 


书 英文 原版 封面 的 蓝 色 : 


Color red = new Color(255, 0， 0); 
Color bookBlue = new Color( 9, 90, 166); 


从 1.5 节 开 始 ， 我 们 就 开始 使 用 模块 StdDraw 中 的 颜色 ;但 是 
仅 局 限于 车 干预 定义 颜色 ， 比 如 StdDraw.BLACK、StdDraw.RED 
和 StdDraw.PINK。 从 现在 开始 ， 我 们 有 数 百 万 种 颜色 可 供 使 用 。AlbersSquares (程序 3.1.2 ) 
是 一 个 StdDraw 客户 端 程序 ， 可 以 用 于 各 种 与 颜色 有 关 的 实验 。 





程序 3.12 亚 伯 斯 正方 形 































import java.awt.Color; 


public class AlbersSquares 


public static void main(String[] args) 






int rl = Integer.parseInt(args[0]); 
int gl = Integer.parseInt(args[1]); 
int bl = Integer.parseInt(args[2]); 
Color cl = new Color(r1l, gl1, b1); 


int r2 = Integer.parseInt(args[3]); 
int g2 = Integer.parseInt(args[4]); 
int b2 = Integer.parseInt(args[5]); 
Color c2 = new Color(r2, g2, b2); 


StdDraw.setPenColor(c1); 
StdDraw.filledSquare(.25, 0.5, 0.2); 
StdDraw.setPenColor(c2); 
StdDraw.filledSquare(.25, 0.5, 0.1); 
StdDraw. setPenColor(c2); 
StdDraw.filledSquare(.75, 0.5, 0.2); 
StdDraw. setPenColor(c]1); 
StdDraw.filledSquare(.75, 0.5, 0.1); 





} 
} 





网 站 ( www.hzbook.com ) 下 载 和 查阅 ) 


% java AlbersSquares 9 90 166 100 100 100 


日 、 原 书 为 蓝 色 。 一 一 译 者 注 


这 个 程序 从 命令 行 接收 两 个 RGB 方 式 的 参数 值 作为 需要 显示 的 颜色 信息 ， 
并 采用 颜色 理论 家 约瑟夫 亚 伯 斯 ( Josef Albers ) 在 20 世 纪 60 年 代 开 发 的 类 似 
格式 ,约瑟夫 ， 亚 伯 斯 改变 了 人 们 思考 色彩 的 方式 。 (彩色 原 图 可 通过 华章 


blue 

0 0 red 
255 , 闪 green 

V3 255 blue 

0 0 black 
100 100 darkgray 
293 5 -white 
35 yellow 

0 255 magenta 
90 166 thiscolor© 
一 些 颜 色 值 


ri，g1，bl | RGB 值 


cl 第 一 个 颜色 上 


r2，92，b2 | RGB 值 


c2 第 二 个 颜色 
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像 我 们 学 习 每 一 个 新 的 抽象 类 时 一 样 ， 我 们 只 通过 Java 颜色 模型 的 关键 元 素来 介绍 
Color， 而 不 会 深入 所 有 的 细节 。Color 的 API 包含 几 个 构造 函数 和 20 多 个 方法 ; 常用 的 将 
在 下 面 简单 介绍 。 


public class java.awt.Color 








ColoarpCint rE,. intrg, int,b) 


int getRed() 红色 的 强度 
int getGreen() 绿色 的 强度 
int getBlue() 蓝 色 的 强度 
Color brighter() 比 此 颜色 更 亮 一 些 的 颜色 
Color darkerO) 比 此 颜色 更 暗 一 些 的 颜色 
String toString() 能 表示 此 颜色 的 字符 串 


String equals(Object c) ”颜色 的 值 和 对 象 是 否 一 样 ? 
其 他 有 用 的 方法 可 参考 在 线 文档 和 本 韦 网 站 
Java Color 数据 类 型 的 API (部 分 ) 


我 们 的 主要 目的 是 用 Color 作为 例子 来 说 明 面向 对 象 程序 设计 ， 同 时 开发 一 些 实用 的 工 
具 ， 用 于 编写 处 理 颜色 的 程序 。 接 下 来 ， 我 们 选择 一 种 颜色 属性 作为 示例 ， 以 证 明 通过 编写 
面向 对 象 的 代码 来 处 理 抽象 概念 (如 颜色 ) 是 一 种 方便 、 有 效 的 方法 。 

亮度 。 现 代 显示 器 (如 LCD 显示 器 、LED 电视 和 手机 屏幕 ) 上 的 图 像 质量 依赖 于 一 种 
颜色 属性 ， 称 为 单 色 亮度 (monochrome luminance) 或 有 效 亮度 。 亮 度 的 标准 公式 是 根据 眼 
睛 对 红色 、 绿 色 和 蓝 色 的 敏感 度 推导 出 来 的 。 它 是 三 种 颜色 分 量 的 线性 组 合 方程 : 如 果 一 个 
颜色 的 红色 、 绿 色 和 蓝 色 分 量 值 分 别 是 >、g 和 b， 则 其 亮度 了 的 定义 公式 为 : 

7=0.299r+0.587g+0.114b 

由 于 系数 为 正 且 系数 之 和 为 1， 而 各 颜色 分 量 的 取 值 范围 为 0 到 255 的 整数 ， 因 此 亮度 
的 取 值 范围 为 0 到 255 的 实数 。 a 

灰 度 。RGB 颜色 模型 具有 以 下 特性 : 当 三 种 颜色 go ogo 166 此 颜色 是 
分 量 强度 相同 时 ， 所 得 结果 颜色 是 位 于 黑色 (全 0) 到 4 美文 中 颜色 ) 
白色 (全 部 255 ) 之 间 的 灰 度 颜色 。 如 果 要 在 黑白 报纸 ” 74 74 “74 ， 克 皮 版 本 ” 国 
(或 书籍 ) 上 印刷 一 幅 彩 色 图 像 ， 则 必须 使 用 函数 将 其 0 x& 国 
转换 为 灰 度 图 像 。 将 彩色 图 像 转换 为 灰 度 图 像 最 简单 的 
方法 是 将 红 、 绿 、 蓝 分 量 值 蔡 换 成 其 单 色 亮度 值 。 0.299*9 + 0.587*+ 90 + 0.114* 166 = 74.445 

颜色 兼容 性 。 单 色 亮 度 也 是 确定 两 种 颜色 是 否 兼容 “” 灰 度 颜色 示例 (彩色 原 图 可 通过 华章 
的 关键 要 素 。 两 种 颜色 的 兼容 性 是 指 在 以 一 种 颜色 为 背 ， 网 站 (www hzbook'com) 下 载 和 查阅 ) 
景 时 另 一 种 颜色 的 可 阅读 性 。 一 个 广泛 使 用 的 经 验 法 则 是 : 前 景色 和 背景 色 的 亮度 差 至 少 应 
该 是 128。 例如， 白色 背景 上 的 黑色 文本 具有 255 的 亮度 差 但 黑色 文本 在 本 书 英文 版 原 书 
的 蓝 色 背景 下 亮度 差 只 有 74。 这 个 法 则 在 广告 设计 、 道 路 标志 、 网 站 和 许多 其 他 应 用 程序 
的 设计 中 十 分 重要 。Luminance (程序 3.1.3 ) 是 一 个 静态 方法 的 库 ， 可 以 用 于 将 一 种 颜色 转 
换 为 灰 度 ， 也 可 以 测试 两 种 颜色 是 否 兼容 。 程 序 中 的 静态 方法 说 明了 使 用 数据 类 型 来 组 织 信 
息 的 效用 。 因 为 如 果 不 使 用 Color， 那 么 就 会 一 次 传递 三 个 强度 值 ， 这 个 方法 就 变 得 非常 麻 
烦 ， 并 且 在 没有 引用 类 型 的 情况 下 ， 返 回 多 个 值 是 不 可 能 的 。 使 用 Color 对 象 作为 参数 和 返 
回 值 大 大 简化 了 实现 。 


历 向 对 聚 编 短 





颜色 兼容 性 示例 (彩色 原 图 可 通过 华章 网 站 (www.hzbook.com ) 下 载 和 查阅 ) 






程序 3.1.3 “亮度 模块 







import java.awt.Color; 
public class Luminance 






public static double intensity(Color color) 
{ /1 颜色 的 单 色 亮度 
int r = color.getRed(); r，g,，b| RGB 值 
int g = color.getGreenO; 
int b = color.getBlue(); 
return 0.299*r + 0.587*g + 0.114*b; 




















} 


public static Color toGray(Color color) 

{ ”VY/ 使 用 亮度 转换 为 灰 度 
int y = (int) Math.round(intensity(color)); 
Color gray = new Color(y, y, y); 
return gray; 








public static boolean areCompatible(Color a, Color b) 
{ /W 如 果 颜 色 兼容 则 返回 真 , 否则 为 假 
return Math.abs(intensity(a) - intensity(b)) >= 128.0; 


} 


public static void main(String[] args) 
{ // 两 种 指定 的 RGB 颜 色 是 否 兼容 

int[] a = new int[6]; 

for (int i = 0; i < 6; i++) 












> 
} 


该 模块 包含 三 个 用 于 处 理 颜色 的 重要 函数 : 单 色 亮度 、 将 颜色 转换 为 灰 
度 、 背 景色 和 前 景色 兼容 性 测试 。 











% java Luminance 232 232 232 0 0 6 
true 
% java Luminance 9 90 166 232 232 232 
true 
% java Luminance 9 90 166 0 0 0 
false 








y | color 的 亮度 


a[i] = Integer.parseInt(args[i]); a[] |args[] 的 整 型 值 
Color cl = new Color(a[0], a[1], a[2]); cl | 第 一 种 颜色 
Color c2 = new Color(a[3], a[4], a[5]); A < 
StdOut.printin(areCompatible(c1, c2)); c2 | 第 二 种 颜色 
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颜色 抽象 的 重要 性 不 仅仅 在 于 可 以 直接 使 用 ， 还 可 以 用 于 构建 包含 Color 值 的 高 级 数据 
类 型 。 接 下 来 ,我 们 将 通过 开发 一 个 建立 在 颜色 抽象 基础 上 的 数据 类 型 来 说 明 这 一 点 ， 该 数 
据 类 型 可 用 于 编写 处 理 数 字 图 像 的 程序 。 
数字 图 像 处 理 ” 你 肯定 熟悉 照片 的 概念 。 从 技术 上 讲 ， 照 片 可 以 定义 为 通过 对 电磁 波 


344 
345 
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辐射 的 可 见 光波 长 的 收集 和 聚焦 ， 构 成 一 个 场景 在 某 个 时 间 点 的 二 维 图 像 。 这 个 技术 定义 超 
出 了 我 们 所 研究 的 范围 ， 值 得 注意 的 是 摄影 的 历史 是 一 个 技术 发 展 的 历史 。 在 20 世纪 ， 摄 
影 基于 化 学 过 程 ， 但 是 现代 化 摄影 都 是 基于 计算 的 。 相机 和 手机 其 实 就 是 一 个 带 有 镜头 和 感 
光 器 件 、 能 以 数字 形式 捕获 图 像 的 计算 机 ， 而 且 计算 机 具有 照片 编辑 软件 ， 可 以 处 理 这 些 图 
像 。 用 户 可 以 裁剪 、 放 大 和 缩小 图 像 ， 调 整 图 像 的 对 比 度 ， 增 加 或 减少 图 像 的 亮度 ， 去 除 红 
眼 ， 或 执行 许多 其 他 操作 。 给 定 一 个 简单 的 捕获 数字 图 像 思想 的 基本 数据 类 型 ,许多 诸如 此 
类 的 操作 则 非常 容易 实现 。 

数字 图 像 。 处 理 数字 图 像 需要 哪些 值 ?” 针 对 这 些 值 需要 执行 哪些 操作 ? 计算 机 显示 器 的 
基本 抽象 和 数字 照片 一 致 ， 同 样 非常 简单 : 数字 图 像 是 一 个 像素 (图片 元 素 ) 组 成 的 矩形 网 
格 ， 其 中 每 个 像素 的 颜色 是 单独 定义 的 。 数 字 图 像 有 时 被 称 为 光栅 或 位 图 图 像 。 与 之 对 应 
的 ,使 用 StdDraw 生成 的 图 像 类 型 (由 点 、 线 、 圆 和 正方 和 
形 等 几何 对 象 拼接 而 成 ) 被 称 为 失 量 图 像 。 oo 列 。 是 一 个 Color 对 象 

我 们 使 用 Picture 数据 类 型 实现 数字 图 像 的 抽象 。 这 证 | /A 
组 值 是 一 个 Color 对 象 的 三 维和 矩阵 ， 其 操作 包括 创建 一 个 四 
给 定 宽度 和 高 度 的 空白 图 像 ， 从 文件 中 加 载 一 个 图 像 ， 设 
置 某 个 像素 的 颜色 为 给 定 的 颜色 ， 返回 图 像 的 宽度 和 高 
度 ， 在 计算 机 屏幕 的 窗口 中 显示 图 像 ， 以 及 将 图 像 保存 为 
文件 。 在 这 个 描述 中 ,我 们 故意 使 用 和 矩阵 而 不 是 数组 来 强 
调 我 们 指 的 是 一 个 抽象 (一 个 像素 矩阵 )， 而 不 是 一 个 特定 
的 实现 (一 个 Java Color 对 象 的 二 维 数组 )。 使 用 一 个 数 
据 类 型 时 无 须 理解 其 具体 实现 。 的 确 ， 典 型 的 图 像 具 有 如 
此 多 的 像素 ， 所 以 实现 可 能 需要 比 Color 对 象 的 数组 更 有 
效 的 表示 形式 。 在 任何 情况 下 ， 要 编写 处 理 图 像 的 客户 程 数字 图 像 的 解析 
序 ， 只 需要 知道 如 下 API: 














public class Picture 


Picture(String filename) 从 文件 创建 一 个 图 片 
Picture(int w, int h) 创建 一 个 wx h 的 空白 图 片 
int width() 返回 图 片 的 宽度 
int height() 返回 图 片 的 高 度 
Color get(int col, int row) 返回 像素 (col，row) 的 颜色 
void set(int co1，int row，Color c) ”设置 像素 (col，row) 的 颜色 为 c 
void show() 在 窗口 上 展示 图 片 
void save(String filename) 将 图 片 保存 为 文件 
我 们 的 数据 类 型 中 用 于 图 像 处 理 的 API 


按照 惯例 , (0，0) 表示 左上 角 的 像素 ， 所 以 图 像 的 排列 顺序 与 矩阵 相同 (相对 地 ， 
StdDraw 模块 的 规则 是 点 ( 0,0 ) 位 于 左下 角 ， 以 使 得 绘图 的 方向 与 笛 卡 儿 坐 标 系 的 方式 保 
持 一 致 )。 大 多 数 图 像 处 理 程序 其 实 就 是 过 滤器 ， 即 先 扫描 源 图 像 中 的 所 有 像素 ， 然 后 执行 
一 些 计算 以 确定 目标 图 像 中 每 个 像素 的 颜色 值 。 第 一 个 构造 函数 和 save() 方法 支持 PNG 和 
JPEG 格式 ,这 两 种 格式 使 用 非常 广泛 ,因此 你 可 以 编写 程序 来 处 理 自己 的 照片 ， 并 将 处 理 
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后 的 照片 添加 到 相册 或 者 上 传 到 网 站 。show() 窗口 提供 一 个 交互 式 选项 来 保存 文件 。 这 些 方 
法 与 Java 的 Color 数据 类 型 一 起 为 我 们 打开 了 图 像 处 理 的 大 门 。 
灰 度 。 本 书 网 站 中 包括 大 量 的 彩色 图 像 示 例 ， 本 书 描述 的 所 有 方法 均 适 用 于 全 彩 图 像 ， 
但 是 书 中 所 有 的 示例 图 像 都 是 灰 度 图 。 因 此 ， 我们 的 首要 任务 是 编写 一 个 程序 ， 用 于 将 彩色 
图 像 转 换 为 灰 度 图 像 。 这 个 任务 是 一 个 典型 的 图 像 处 理 基 础 任务 : 源 图 像 中 的 每 个 像素 对 应 ”L347 
于 目标 图 像 中 一 个 不 同 颜色 值 的 像素 。Grayscale (程序 3.1.4 ) 是 一 个 过 滤器 ， 从 命令 行 接 
收 一 个 图 像 文件 名 称 ， 并 生成 该 图 像 的 灰 度 版 本 。 程 序 创建 Picture 对 象 ， 并 初始 化 为 彩色 
图 像 ， 然 后 将 每 个 像素 的 颜色 设置 为 一 个 新 的 Color 值 ， 新 的 Color 值 使 用 Luminance ( 程 
序 3.1.3 ) 中 toGray( 函数 计算 出 的 源 图 像 像 素 点 的 灰 度 值 。 


程序 3.1.4 ”将 彩色 图 像 转 为 灰 度 图 像 

import java.awt.Color; . i 
picture | 从 文件 中 得 到 的 图 片 | 
co1, row | 像素 企 标 


public class Grayscale 


public static void main(String[] args) color | 像素 颜色 值 


{ /二 以 灰 度 显示 图 像 gray | 像素 灰 度 值 
Picture picture = new Picture(args[0]); NN 
for (int col = 0; col < picture.width(); col++) 

{ 


for (int row = 0; row < picture.height(); row++) 


Color color = picture.get(col, row); 
Color gray = Luminance.toGray(color); 
picture.set(col, row, gray); 


picture.show() ; 
} 
} 





这 个 程序 是 一 个 简单 的 图 像 处 理 客户 程序 。 程 序 首先 创建 一 个 Pictore 对 象 ， 并 

| 用 命令 行 参数 命名 的 图 像 文 件 初始 化 该 对 象 。 然 后 通过 计算 每 个 像素 的 颜色 的 灰 度 
“ 值 并 用 它 来 创建 一 个 Color 对 象 。 用 这 个 对 象 来 设置 对 应 像素 的 颜色 ， 从 而 将 图 像 中 
的 每 个 像素 转换 为 灰 度 。 最 后 ， 显 示 转 换 后 的 图 像 。 你 可 以 在 后 文 的 图 像 中 看 见 像 
素 点 ， 因 为 那些 图 像 是 从 低 分 辩 率 图 像 放 大 而 来 (参见 下 一 节 图 像 缩放 的 内 容 ) 。 







% java Grayscale mandri11.jpg % java Grayscale darwin.jpg 





缩放 。 图 像 处 理 最 常见 任务 之 一 是 放大 或 缩小 图 像 。 这 种 基本 操作 被 称 为 缩放 
(scaling)， 它 的 应 用 很 多 ， 如 制作 用 于 聊天 软件 或 手机 上 使 用 的 缩 略图 照片 、 调 整 高 分 辩 率 
照片 的 大 小 以 适应 印刷 或 Web 页 面 的 特定 空间 、 放 大 卫星 照片 或 使 用 显微镜 拍摄 的 图 像 等 。 
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在 光学 系统 中 ， 我 们 仅仅 通过 调整 镜头 就 可 以 达到 所 需 的 缩放 大 小 ， 但 在 数字 图 像 中 必须 要 
做 更 多 的 工作 。 

在 某 些 情况 下 ,缩放 问题 的 实现 策略 变 得 非常 简单 清晰 。 例如， 如 果 目 标 图 像 的 大 小 是 
源 图 像 的 一 半 ( 每 一 个 维度 上 都 是 一 半 )， 可 以 简单 地 通过 选择 一 半 像 
素来 实现 ， 即 删除 一 半 的 行 和 列 。 这 种 技术 被 称 为 采样 ( sampling)。 
如 果 目 标 图 像 是 源 图 像 大 小 (每 个 维度 ) 的 两 倍 ， 可 以 设置 目标 图 像 中 
相 邻 的 四 个 像素 表示 源 图 像 中 同一 个 像素 的 颜色 。 请 注意 ， 缩 小 图 像 
会 导致 丢失 信息 ， 因 此 如 果 先 把 图 像 缩 小 一 半 再 放大 一 倍 ， 通 常 结果 
图 像 与 源 图 像 不 一 致 。 

一 个 简单 的 方案 同样 适用 于 图 像 的 缩小 和 放大 。 我 们 的 目标 是 生 
成 一 个 缩放 过 的 图 像 ， 所 以 从 目标 图 像 中 的 每 个 像素 开始 逐一 处 理 ， 
通过 缩放 每 个 像素 的 坐标 以 确定 源 图 像 中 哪个 像素 的 颜色 可 以 用 来 赋 
值 给 目标 图 像 的 像素 。 假设 源 图 像 的 宽度 和 高 度 分 别 用 w, 和 h, 表示 ， 
目标 图 像 的 宽度 和 高 度 分 别 用 w, 和 表示， 那么 列 索 引 坐 标的 缩放 比 
例 为 wyw;， 行 索引 坐标 的 缩放 比例 为 hyh.。 也 就 是 说 ， 目 标 图 像 第 c 
列 第 r 行 的 像素 的 颜色 对 应 于 源 图 像 第 cXw/w, 列 第 rXh/h, 行 的 像素 
颜色 。 例 如 ， 如 果 要 将 一 幅 图 像 的 大 小 缩减 到 一 半 ， 则 缩放 比例 为 2， 
因此 目标 图 像 的 第 3 列 第 2 行 的 像素 颜色 对 应 于 源 图 像 第 6 列 第 4 行 
的 像素 颜色 ; 如 果 将 图 像 的 大 小 变 成 两 倍 ， 则 缩放 比例 为 12， 因 此 和 目 
标 图 像 的 第 4 列 第 6 行 中 的 像素 颜色 由 源 图 像 的 第 2 列 第 3 行 中 的 像 目标 图 片 
素颜 色 获 得 。Scale (程序 3.1.5 ) 是 这 个 策略 的 一 个 实现 。 更 复杂 的 方 
案 可 以 有 效 地 处 理 旧 网 页 或 旧 相 机 中 低 分 辩 率 的 图 像 。 例 如 ， 可 以 通 
过 将 源 图 像 的 每 四 个 相 邻 像素 点 的 平均 值 作为 目标 图 像 中 的 一 个 像素 
值 。 目 前 大 多 数 应 用 中 的 图 像 通常 为 高 分 辩 率 图 像 ， 程 序 Scale 采用 的 
简单 方法 对 处 理 高 分 辩 率 图 像 非常 有 效 。 

把 目标 图 像 的 每 个 像素 的 颜色 值 视 作 源 图 像 特 定 像素 的 函数 ， 以 
计算 像素 的 颜色 值 ， 这 一 基本 思想 同样 是 各 种 图 像 处 理 任 务 的 有 效 
方法 。 接 下 来 ， 我 们 将 讨论 一 个 例子 ， 更 多 的 示例 请 参见 练习 和 本 书 网 站 。 

淡化 效果 。 接 下 来 我 们 讨论 一 个 有 趣 的 图 像 处 理 示 例 ， 即 通过 一 系列 离散 的 步骤 ， 
将 一 幅 图 像 转换 成 另 一 幅 图 像 。 这 种 转变 有 时 被 称 为 淡化 效果 (fade effect)。Fade ( 程 
序 3.1.6 ) 是 Picture 和 Color 的 一 个 客户 程序 ， 程 序 使 用 线性 插值 法 来 实现 这 种 效果 。 
程序 计算 n-1 个 中 间 图 像 ， 第 i 幅 图 像 中 的 每 个 像素 是 源 图 像 和 目标 图 像 中 相应 像素 的 
加 权 平 均值 。 静 态 方法 blend0) 实现 插值 计算 : 源 图 像 像素 颜色 的 权重 系数 为 1-i/n，, 目 
标 图 像 像素 颜色 的 权重 系数 为 iin ( 当 i 是 0 时 ,为 源 图 像 ， 当 i 是 n 时 ,为 目标 图 像 )。 
这 个 简单 的 计算 方法 可 以 产生 惊人 的 结果 。 当 在 计算 机 上 运行 Fade 程序 时 ， 变 化 将 动 
态 展 现 。 尝 试 在 你 的 照片 库 的 一 些 图 像 上 运行 它 。 注 意 程序 Fade 假定 图 像 具 有 相同 的 
宽度 和 高 度 ， 如 果 两 幅 图 像 大 小 不 同 ， 则 可 以 使 用 Scale 为 Fade 创建 一 个 或 两 个 缩放 的 
图 像 。 


缩小 
源 图 片 


目标 图 片 





放大 - 
源 图 片 








缩放 数字 图 像 


面向 对 复 编 程 ”207 


程序 3.1.5 图像 缩 放 





public class Scale 


public static void main(String[] args) 


{ | wm | 目标 图 像 大 小 
int w = Integer.parseInt(args[1]); | source 源 图 像 
int h = Integer.parseInt(args[2]); | target | 目标 图 像 


Picture source = new Picture(args[0]); jcolT,， rowT 目标 图 像 像 素 坐 标 


Picture target = new Picture(w, h); | < ER 
for (int colT = 0; colT < w; colT++) colS, rows | 源 图 像 像 素 坐标 


{ 
for (int rowT = 0; rowT < h; rowT++) 
{ 
int colS = colT * source.width() / wi; 
int rowS = rowT * source.height() / h; 
target.set(colT, rowT, source.get(colS, rowS)); 
} 
} 
source. show(); 
target.show() ; 








程序 接收 三 个 命令 行 参数 : 图 像 的 文件 名 称 和 两 个 整数 ( 宽度 w 和 高 度 h ) ， 
将 图 像 缩放 为 宽度 为 w、 高 度 为 h 的 大 小 ， 并 显示 缩放 前 后 的 图 像 。 





% java Scale mandrill.jpg 800 800 600 300 








回顾 输入 输出 ”在 1.5 节 中 ， 我们 学 习 了 如 何 使 用 StdIn 和 StdOnut 读 写 数 字 和 文本 ， 并 
使 用 StdDraw 绘制 图 形 。 读 者 肯定 已 经 体会 到 在 程序 中 通过 这 些 实 用 机 制 获取 和 输出 信息 的 
好 处 。 使 用 这 些 模 块 的 方便 之 处 在 于 它们 是 “标准 ” 接 日 ， 又 是 库 函 数 ， 使 得 在 程序 的 任何 
地 方 都 可 访问 这 些 功能 。 但 这 些 “ 标 准 ” 的 一 个 缺点 是 访问 文件 依赖 于 操作 系统 的 管道 和 重 
定向 机 制 ， 并 且 任 何 给 定 程序 只 能 访问 一 个 输入 文件 、 一 个 输出 文件 和 一 个 绘制 的 图 形 。 使 
用 面向 对 象 程序 设计 ， 可 以 定义 与 StdIn、StdOut 和 StdDraw 类 似 的 机 制 ， 而 且 人 允许 在 一 个 
程序 中 同时 使 用 多 个 输入 流 、 输 出 流 和 图 形 。 

我 们 将 在 本 节 中 分 别 定义 用 于 输入 流 、 输 出 流 和 绘图 的 数据 类 型 mm、Out 和 Draw。 像 
往常 一 样 ， 我 们 必须 让 Java 可 以 访问 到 这 些 类 (参见 1.5 节 末 尾 的 问答 环节 )。 
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程序 3.1.6 ”淡化 效果 





import java.awt.Color; 


public class Fade 











public static Color blend(Color c1，Color c2, double alpha) 


{人 计算 颜色 cl 和 c2 的 混合 ， 权 重 是 alpha 
double r 
double g 
double b 
return new Color((int) r, (int) g, (int) b); 


[| 


public static void main(String[] args) 
{ -办 显示 从 源 图 像 到 目标 图 像 的 m 个 渐变 图 像 
Picture Source = new Picture(args[0]); 
Picture target = new Picture(args[1]); 
int n = Integer.parseInt(args[2]); 
int width = source.widthO); 
int _ height = source.height(); 
Picture picture = new Picture(width, height); 
for (int 1 = 0; 1 <= ns i++) 
for (int col = 0; col < width; col++) picture 
i 
cl 
Color cl = source.get(col, row); | c2 
Color c2 = target.get(col, row); 
double alpha = (double) i / ni; , 
Color color = blend(cl1l, c2, alpha); 
picture.set(col, row, color); 


for (int row = 0; row < height; row++) 


picture.show() ; 


(1l-alpha)*cl.getRed() + alpha*c2.getRed(); 
(1-alpha)*cl.getGreen() + alpha*c2.getGreen(); 
(1-alpha)*cl.getBlue() + alpha*c2.getBlue(); 


图 像 的 数量 

当前 图 像 
图 像 的 计数 器 

源 图 像 像素 颜色 | 
目标 图 像 像素 颜色 | 
混合 图 像 像素 颜色 








为 了 将 一 幅 图 像 在 ?个 步骤 中 淡化 为 另 一 张 图 像 ， 我 们 将 第 ;企图 像 的 每 个 
像素 设置 对 应 源 图 像 和 目标 图 像 的 像素 点 的 加 权 平 均值 ， 其 中 源 图 像 像素 颜色 
的 权重 系数 为 1-i/n， 目 标 图 像 像素 颜色 的 权重 系数 为 Xn。 下 列 图 片 展 示 了 这 个 


| 例子 中 描述 的 转换 过 程 。 


% java Fade mandrill.jpg darwin.jpg 9 





历 向 对 痕 编 程 209 


这 些 数据 类 型 使 我 们 能 够 灵活 地 处 理 Java 程序 中 许多 常见 的 数据 处 理 任务 。 我 们 可 以 
很 容易 地 创建 每 种 数据 类 型 的 多 个 对 象 ， 将 数据 流连 接 到 不 同 的 数据 源 和 数据 目标 ， 而 不 是 


仅 限于 一 个 输入 流 、 一 个 输出 流 和 一 个 绘图 。 我 们 还 


可 以 灵活 地 设置 变量 来 引用 这 些 对 象 ， 将 它们 作为 参 ”物流 


数 传递 给 函数 或 方法 ， 或 从 函数 或 方法 返回 值 ， 或 者 
创建 它们 的 数组 ， 就 像 我 们 操作 任何 数据 类 型 的 对 象 
一 样 操 作 它们 。 我 们 会 在 介绍 完 API 后 讨论 几 个 应 
用 实例 。 

输入 流 数 据 类 型 。 我 们 的 In 数据 类 型 是 StdIn 的 
一 个 更 通用 的 版 本 ,支持 从 文件 、 网 站 以 及 标准 输入 
流 中 读 取 数字 和 文本 。 它 实现 了 输入 流 (input stream ) 
数据 类 型 ， 其 中 API 如 下 文 所 示 。 这 种 数据 类 型 不 仅 
仅 局 限于 某 一 个 抽象 输入 流 (标准 输入 )， 还 允许 直 
接 指定 输入 流 的 数据 源 。 数 据 源 甚至 可 以 是 文件 或 网 
站 。 当 使 用 一 个 字符 串 参 数 调用 In 构造 函数 时 ， 构 






命令 行 参数 


标准 输出 


造 函数 首先 尝试 在 本 地 计算 机 中 查找 对 应 该 文件 名 的 “二 个 Jav 往 庆 的 鸟 庆 图 (再 次 回顾) 


文件 。 如 果 找 不 到 该 文件 ， 则 假设 参数 是 一 个 网 站 名 


称 ， 并 尝试 连接 到 该 网 站 (如 果 不 存在 这 样 的 网 站 ， 则 运行 时 会 产生 异常 )。 在 这 两 种 情况 
下 ， 指 定 的 文件 或 网 站 都 将 成 为 输入 数据 源 ， 用 于 创建 In 对 象 ， 并 且 使 用 read*() 方法 从 对 


应 的 流 读 取 输 入 数据 。 


public class In 





InO) 从 标准 输入 创建 一 个 输入 流 


In(String name) 从 文件 和 网 页 创建 输入 流 
从 输入 流 中 读 取 特定 元 素 的 实例 方法 


boolean isEmpty() 标准 输入 是 否 为 空 (或 上 内 有 空白 格 ) 
int readInt() 读 取 一 个 数据 ， 将 其 转换 一 个 整 型 值 ， 然 后 将 其 返回 
double readDouble() 读 取 一 个 数据 ; -将 其 转换 一 个 双 精 度 浮 点 值 ， 然 后 将 其 返回 


从 输入 流 中 读 取 字符 的 实例 方法 


boolean hasNextChar() 标准 输入 是 否 有 剩余 字符 ? 
char readChar() 从 标准 输入 中 读 取 一 个 字符 并 返回 


从 输入 流 中 读 取 多 行 的 实例 方法 
boolean hasNextLine() 标准 输入 是 否 有 下 一 行 


String readLineO) 
读 取 输入 流 中 其 他 部 分 的 实例 方法 
int[] readAllInts() 
double[] readA11DoublesO) 


读 取 该 行 的 其 余部 分 并 将 其 作为 字符 串 返 回 


读 取 剩 下 的 所 有 标记 ; 并 作为 整 型 数组 返回 
读 取 剩 下 的 所 有 标记 ; 并 作为 浮 点 数组 返回 


注意 : In 对 象 也 支持 StdIn 所 支持 的 所 有 操作 
我 们 的 输入 流 对 象 的 API 设计 354 
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这 种 设计 使 得 在 同一 个 程序 中 处 理 多 个 文件 成 为 可 能 。 此 外 ， 直 接 访 问 网 络 的 能 力 可 以 
将 整个 网 络 作为 程序 的 潜在 输入 ， 如 允许 用 户 处 理由 其 他 人 提供 和 维护 的 数据 。 这 种 类 型 的 
数据 遍布 整个 Web。 科 学 家 们 现在 定期 上 传 测量 结果 或 实验 结果 的 数据 文件 ， 从 基因 组 和 
蛋白 质 序 列 到 卫星 照片 和 天 文 观 测 ; 金融 服务 公司 ， 如 证 券 交 易 所 也 会 定期 发 布 关于 股票 
和 其 他 金融 方面 的 详细 信息 ; 政府 部 分 公布 选举 结果 等 。 现 在 我 们 可 以 编写 直接 读 取 这 些 
文件 的 Java 程序 。In 数据 类 型 使 得 我 们 可 以 充分 利用 众多 可 用 数据 源 ， 极 大 提高 了 程序 的 
灵活 性 。 

输出 流 数据 类 型 。 同 样 ，Onut 数据 类 型 是 StdOut 的 更 通用 的 版 本 ， 它 支持 写 人 字符 串 
到 各 种 不 同 的 输出 流 ， 包 括 标准 输出 和 文件 。 同 样 ，API 中 指定 了 与 StdOut 相对 应 的 方法 。 
在 调用 构造 函数 时 ， 指 定 一 个 文件 名 作为 其 参数 ， 可 以 指定 要 用 于 输出 的 文件 。Onut 将 参数 
字符 串 解释 为 本 地 计算 机 上 的 一 个 新 文件 名 ， 并 将 结果 写 人 该 文件 。 如 果 调 用 .Out 构造 函数 
时 没有 指定 任何 参数 ， 结 果 将 写 人 标准 输出 。 


public class Out 


Out0) 创建 一 个 输出 到 标准 输出 
Out(String name) 创建 一 个 输出 到 指定 的 文件 
void print(String s) 打印 字符 串 s 到 输出 流 
void printin(String s) 打印 字符 串 s 和 换行 符 到 输出 流 
void println(0) 打印 换行 符 到 输出 流 
void printf(String format, ...) he aR eb 并 按照 指定 的 
输出 流 数 据 类 型 的 API 


程序 3.1.7 ”拼接 文件 





public class Cat 
public static void main(String[] args) 


Out out = new Out(args[args.length-1]); 
for (int i = 0; i < args.length - 1; i++) 


TE 
In in = new In(args[i]); Pt 输出 流 
String s = in.readA11(); i | 参数 索引 
out.print1in(s); in 上 | 当前 的 输入 流量 
} s | 当前 文件 的 内 容 
” 


该 程序 创建 一 个 输出 文件 ， 其 名 称 由 程序 最 后 一 个 命令 行 参数 指定 ， 输 出 
文件 的 内 容 是 一 系列 输入 文件 的 拼接 ， 一 系列 输入 文件 名 由 程序 其 他 命令 行 参 


数 指定 。 
% more inl.txt % java Cat inl.txt in2.txt out.txt 
This is : % more out.txt 
% more in2.txt This is 
a tiny a tiny 


test. test. 


面向 对 复 编 程 211 


文件 拼接 和 过 滤 。 程 序 3.1.7 是 In 和 Out 的 客户 端 示例 程序 。 程 序 使 用 多 个 输入 流 ， 将 
多 个 输入 文件 拼接 成 一 个 单独 的 输出 文件 。 有 些 操 作 系 统 提供 一 个 称 为 cat 的 命令 行程 序 来 
实现 这 个 功能 。 但 是 ,实现 类 似 功能 Java 程序 也 许 更 有 用 ， 因 为 可 以 不 同方 式 修改 Java 程 
序 来 过 滤 输 入 文件 ， 如 忽略 不 相关 的 信息 、 更 改 格式 、 选 择 部 分 数据 等 。 程 序 中 讨论 了 其 中 
一 种 处 理 的 示例 ， 其 他 的 处 理 示例 请 参见 练习 。 

Web 信息 抓 取 。In 数据 类 型 (用 于 通过 Web 网 页 创建 一 个 输入 流 ) 和 String 数据 类 型 
(用 于 提供 强大 的 工具 来 处 理 文本 字符 串 ) 的 结合 ,使 得 Java 程序 可 以 直接 访问 整个 Web， 
而 无 须 依赖 操作 系统 或 浏览 器 。 我 们 把 这 样 的 过 程 称 为 Web 信息 抓 取 : 目标 是 用 程序 从 网 
页 中 提取 一 些 信息 ， 而 无 须 使 用 浏览 器 的 浏览 和 搜索 功能 。 要 实现 这 个 目标 ， 可 以 充分 利用 
许多 网 页 为 高 度 结构 化 的 文本 文件 的 特点 〈 因 为 它们 是 由 计算 机 程序 创建 的 ! )。 浏 览 器 具有 
允许 用 户 查 看 正在 浏览 的 网 页 的 源 代码 功能 ， 通 过 查看 源 代码 可 以 猜测 其 结果 。 

假设 我 们 以 一 个 股票 交易 代码 作为 命令 行 .….. 
参数 ， 希 望 输出 其 当前 的 交易 价格 。 股 票 信息 由 《C00@ </h2> <span class="rtq- 
金融 服务 公司 和 互联 网 服务 提供 商 在 网 上 发 布 。 Seo 2 
例如 ， 通 过 浏览 网 址 http://finance.yahoo.com/ </span></div></div> 
q?s=goog, 可 查看 代号 为 goog 的 公司 股票 价格 。 <div class="yfi_rt quote summary_rt_top 
同 放 多 网 页 一 样 ， 这 个 网 站 中 包 全 了 一 个 参数 09 全 Ga 
( goog), 我 们 可 以 将 其 替换 为 其 他 股票 代码 ， 以 <span deyfse L9400 pdr100. /spanx 
获得 其 他 公司 金融 信息 的 网 页 。 而 且 ， 就 像 网 络 </span> <span class="down_r time_rtq_ 
上 的 许多 其 他 文件 一 样 ， 被 引用 的 文件 也 是 一 个 “re ”<SPan 0 Yc03-g009 > 
文本 文件 ， 使 用 一 种 称 为 HTML 的 格式 语言 纺 
写 。 从 Java 程序 的 角度 看 ， 它 可 以 看 作 通 过 一 个 
In 对 象 访问 的 String 值 。 我 们 可 以 使 用 浏览 器 下 载 该 文件 的 源 代 码 ， 或 者 使 用 如 下 命令 将 源 
文件 保存 到 计算 机 的 本 地 文件 goog.html (尽管 没有 必要 这 么 做 ): 


% java Cat "http://finance.yahoo.com/q?s=go00g' goog.htm] 


现在 ,假设 goog 的 交易 价格 为 $1,100.62。 如 果 在 源 代码 文件 中 搜索 字符 串 “1,100.62”"， 你 
将 发 现 股票 价格 出 现在 HTML 代码 中 的 某 个 位 置 。 用 户 不 必 了 人 解 HTML 的 细节 ， 只 要 于 
清楚 股票 价格 出 现 的 站 下 文 即 可 。 在 上 述 情况 下 ,我 们 可 以 发 现 股票 价格 包含 在 子 字 符 串 
<span id=”yfs_184goog”> 以 及 </span> 之 间 。 

使 用 String 数据 类 型 的 indexOf() 和 substring() 方法 可 以 轻松 获取 股票 价格 信息 ， 具 体 
参见 StockQuote (程序 3.1.8 ) 所 示 。 该 程序 依赖 于 http://finance.yahoo.com 使 用 的 Web 页 
面 格式 ， 如 果 其 页 面 格 式 发 生 更 改 ，StockQuote 可 能 无 法 正常 工作 。 事 实 上 ， 当 读者 阅读 本 
书 时 ， 该 Web 页 面 格 式 可 能 已 经 改变 了 。 即 便 如 此 ， 自 己 修 改 程序 以 适应 变化 的 页 面 格式 
也 不 会 很 困难 。 读 者 可 以 通过 各 种 有 趣 的 方式 来 修改 StockQuote。 例 如 ， 可 以 实现 周期 性 获 
取 股 票 价格 并 绘制 股票 图 ， 计 算 股份 变化 的 平均 值 ， 或 将 结果 保存 到 一 个 文件 以 供 后 续 分 析 
使 用 。 当 然 ， 同 样 的 技术 也 适用 于 所 有 的 Web 数据 源 ， 更 多 信息 请 参见 本 节 未 尾 的 练习 示 
例 以 及 本 书 网 站 。 

抽取 数据 。 在 程序 中 维护 多 个 输入 流 和 输出 流 ， 使 得 我 们 可 以 处 理 来 自 不 同 数据 源 的 
大 量 数据 。 我 们 将 讨论 一 个 示例 : 假设 一 个 科学 家 或 者 一 个 金融 分 析 师 有 保存 在 电子 表格 程 


来 源 于 Web 的 HTML 代码 
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序 中 的 海量 数据 。 通 常 ， 电 子 表格 是 包含 大 量 行 和 相对 少 的 列 的 表格 。 用 户 感 兴趣 的 可 能 并 
不 是 电子 表格 中 的 所 有 数据 ， 而 是 少数 几 列 。 我 们 可 以 使 用 电子 表格 程序 进行 计算 ( 毕 竞 使 
用 电子 表格 的 目的 就 是 用 于 计算 )， 但 是 电子 表格 肯定 没有 Java 程序 灵活 。 针 对 这 种 情况 的 
解决 方法 是 把 电子 表格 的 数据 导出 到 文本 文件 中 ， 并 使 用 特殊 字符 来 分 隔 列 ， 然 后 编写 一 
个 Java 程序 从 输入 流 中 读 取 该 文本 文件 。 一 种 标准 的 最 佳 解 决 方案 是 使 用 逗号 作为 分 隔 符 : 
每 行 数据 占 一 行 ， 每 行 的 列 数据 用 逗号 分 隔 。 这 样 的 文件 被 称 为 过 号 分 隔 文 件 或 .csy 文 件 。 
使 用 Java 的 String 数据 类 型 中 的 split() 方法 ， 可 以 实现 逐 行 读 取 数 据 并 分 离 各 数据 项 。 本 
书后 面 将 会 讨论 这 种 方法 的 几 个 例子 。Split (程序 3.1.9 ) 是 瑟 和 Out 的 客户 程序 ， 进 一 步 
实现 了 如 下 功能 : 程序 创建 多 个 输出 流 ， 每 个 文件 对 应 一 列 数据 。 

这 些 例 子 清 晰 地 说 明了 使 用 多 个 输入 输出 流 ， 操 作文 本 文件 是 多 么 的 便捷 ， 这 种 机 
制 甚至 可 以 用 于 直接 访问 Web 页 面 。Web 页 面 基于 HTML 编写 ， 所 以 可 以 被 任何 可 读 取 
字符 串 的 程序 访问 。 之 所 以 采用 这 些 非常 简单 的 文本 格式 ， 就 像 .csv 这 样 ， 而 不 是 依赖 
于 具体 程序 的 复杂 数据 格式 ， 是 为 了 允许 尽 可 能 多 的 人 可 以 使 用 简单 的 程序 (如 Split) 
访问 数据 。 


程序 3.1.8 ”股票 报价 的 Web 信 息 抓 取 
public class StockQuote 


private static String readHTML(String symbo1) 

{ // 返回 与 股票 代码 对 应 的 HTML 1 
In page = new In("http://finance.yahoo.com/q?s=" + symbol1); | 
return page.readA110) ; 1 

symbo] 票 代 码 

public static double priceOf(String symbo]) 输入 流 

{ /返回 当前 股票 代码 的 价格 
String html = readHTMLCsymbo1) ; 
int p = html.indexOf("yfs_184"”", 0); 
int from = html.indexOf(">", p); 
int to = html.indexOf("</span>", from); 
String price = html.substring(from + 1, to); 
return Double.parseDouble(price.replaceAll(",", "" 





public static void main(String[] args) html | 页 面 的 内 容 
{ /VW 打印 指定 股票 代码 的 价格 p “|yfs_184 索 引 
String symbol = args[0]; from | > 索引 


double price = price0f(Csymbo1) ; 

Stdout.printlnCprice) ; 起 </span> 索 引 
} price | 当前 的 价格 
} 。 。 


该 程序 接受 一 个 股票 代码 作为 命令 行 参 数 ， 并 在 标准 输出 中 写 入 当前 股票 
的 价格 ， 当 前 股票 价格 来 自 于 网 站 http/ finance.yahoo.com 上 提供 的 实时 信 
息 。 程 序 使 用 String 中 的 indexOfO 、substring0 和 replaceAll0 方 法 。 


% java StockQuote goog 
1100.62 

% java StockQuote adbe 
X05 


面向 对 痛 编 程 







程序 3.1.9 "分割 一 个 文件 


public class Split 





public static void main(String[] args) n 字段 的 数量 






String name = args[0]; 






int n = Integer.parseInt(args[1]); i 输入 流 
String delimiter = ","; out[] 输出 流 
// 创建 输出 流 line 当前 行 





Out[] out = new Out[n]; fields[] 
for (int i = 0; i < ni i++) 


out[i] = new Out(name + i + ".txt"); 





























In in = new In(name + ".CSV"); 

while (in.hasNextLine()) 

{ / 读 取 一 行 并 将 字 摧 写 到 输出 流 
String line = in.readLineO; 
String[] fields = line.split(delimiter); 
for (int 1 = 0; i < ni i++) 

out[i] .printin(fields[i]); 








该 程序 使 用 多 个 输出 流 将 .csv 文 件 拆 分 为 几 个 单独 的 文件 ， 每 个 文件 对 应 
以 逗号 分 隔 的 字段 。 与 第 i 个 字段 相对 应 的 输出 文件 的 名 称 是 通过 将 i 和 ,csv 连 
接 到 原始 文件 名 的 末尾 形成 的 。 








% more DJIA.csv % java Split DJIA 4 


ev % more DJIA2.txt 
31-0ct-29,264.97,7150000,273.51 





30-0ct-29,230.98,10730000,258.47 7150000 
29-0ct-29,252.38,16410000,230.07 10730000 
28-0ct-29,295.18,9210000,260.64 16410000 
25-Oct-29,299.47,5920000,301.22 9210000 
24-0ct-29,305.85,12900000,299.47 5920000 
23-0ct-29,326.51,6370000,305.85 12900000 
22-0ct-29,322.03,4130000,326.51 6370000 
4130000 





21-0ct-29,323.87,6090000,320.91 
% 6090000 


绘图 数据 类 型 。 本 节 前 面 讨 论 过 Picture 数据 类 型 ， 使 用 这 种 数据 类 型 ， 我 们 可 以 编写 
处 理 多 个 图 片 、 图 片 数 组 等 的 程序 ， 这 正 是 因为 这 种 数据 类 型 提供 了 使 用 Picture 对象 进行 
计算 的 能 力 。 当 然 , 我 们 也 希望 拥有 与 StdDraw 类 似 的 创建 几何 对 象 的 计算 能 力 。 因 此 ， 我 
们 有 一 个 具有 以 下 API 的 Draw 数据 类 型 : 


public class Draw 
DrawO) 
绘图 命令 
void line(double x0, double y0, double x1, double y1) 
void point(double x, double y) 
void circle(double x, double y, double radius) 
void filledCircle(double x, double y, double radius) 


控制 命令 
void setXscale(double x0, double x1) 
void setYscale(double y0, double y1) 
void setPenRadius(double radius) 


注意 : Draw 数 据 类 型 对 象 也 支持 StdDraw 所 支持 的 所 有 操作 。 





nane ”| 基本 文件 名 称 


{ /1 按 列 将 一 个 文件 分 割 成 n 个 文件 delimiter | 分 隔 符 (逗号) 


当前 行 中 的 值 
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对 于 任何 数据 类 型 ,我 们 可 以 使 用 来 new 创建 一 个 新 的 Draw 对 象 并 将 其 引用 给 一 个 变 
量 ， 并 使 用 该 变量 名 称 来 调用 创建 图 形 的 函数 。 例 如 ， 代 码 


Draw draw = new Draw() ; 
draw.circle(0.5，0.5，0.2); 


在 屏幕 上 一 个 窗口 的 中 心 画 一 个 圆圈 。 与 Picture 一 样 ， 每 个 图 形 都 有 自己 的 窗口 ， 因 此 可 
以 解决 调用 程序 来 同时 展示 多 个 图 形 的 问题 。 

引用 类 型 的 属性 。 现 在 你 已 经 见 过 几 个 引用 类 型 的 例子 了 (Charge、Color、Picture、 
String、In、Out 和 Draw)， 以 及 使 用 它们 的 客户 端 程序 示例 。 下 面 ， 我 们 将 详细 地 讨论 其 基 
本 属性 。 在 很 大 程度 上 ，Java 的 初学 者 不 必 知 道 这 些 细节 。 然 而 ,经验 丰富 的 程序 员 知 道 ， 
正确 理解 这 些 属性 有 助 于 编写 正确 、 有 效 以 及 高 性 能 的 面向 对 象 程序 。 

下 面 的 表格 表述 了 物体 及 其 名 称 之 间 的 区 别 , 都 是 我 们 熟悉 的 内 容 : 





类 型 典型 的 对 象 典型 的 名 称 
网 站 本 书 网 站 http://introcs.cs.princeton.edu 
人 计算 机 科学 之 父 艾 伦 ' 图 灵 
行星 太阳 系 的 第 三 颗 行 星 地 球 
建筑 物 我 们 的 咖啡 厅 奥 尔 登 街 35 号 
船 1912 年 沉没 的 超级 航 轮 RMS 泰 坦 尼克 号 
数字 圆 的 周 长 / 直 径 在 
Picture new Picture("mailrill.jpg") picture 


给 定 对 象 可 能 有 多 个 名 称 ， 但 每 个 对 象 都 有 自己 的 标识 。 我 们 可 以 在 不 改变 对 象 的 值 的 
情况 下 (通过 赋值 语句 ) 为 对 象 创 建 一 个 新 的 名 称 ， 但 是 当 我 们 更 改 对 象 的 值 (通过 调用 实 
例 方 法 ) 时 ， 所 有 对 象 的 名 称 都 会 引用 这 个 被 更 改 的 对 象 。 

下 面 的 比喻 可 能 会 帮助 读者 将 这 个 重要 的 区 别 铭记 于 心 。 假 设 我 们 想 将 房子 重新 装潢 ， 
于 是 用 铅笔 在 纸 上 写 平房 子 的 街道 地 址 ， 然 后 将 它 发 给 一 些 房屋 粉刷 匠 。 现 在 ， 如 果 聘 请 其 
中 一 个 粉刷 匠 粉 刷 ,房子 会 刷 成 另 一 种 颜色 。 任 何 一 张 纸 上 的 内 容 都 没有 改变 ,但 它们 指示 
的 房子 已 经 改变 了 。 其 中 一 位 粉刷 匠 可 能 会 抹 去 纸 上 的 内 容 并 写 下 另 一 间 房 子 的 地 址 ， 但 是 
改变 一 张 纸 上 的 内 容 并 不 会 改变 其 他 纸 上 的 内 容 。Java 引用 就 像 这 些 纸 片 : 它们 持 有 对 象 的 
名 称 。 更 改 引 用 不 会 更 改 对 象 ， 但 更 改 对 象 会 使 引用 该 对 象 的 所 有 用 户 都 改变 。 

著名 的 比利时 艺术 家 勒 内 马 格 利 特 (René Magritte) 在 


一 幅 画 中 表达 出 了 引用 的 概念 ， 他 创作 了 一 个 烟斗 的 图 像 ， 下 
面 是 解释 文字 : ceci n’est pas une pipe (这 不 是 一 个 烟斗 )。 我 
们 可 以 理解 说 明文 字 的 意思 为 : 画 中 的 烟斗 不 是 真实 的 烟斗 ， 


而 只 是 一 个 烟斗 的 图 像 。 也 许 马 格 利 特 的 意思 是 说 :说 明文 字 “ 
既 不 是 一 个 烟斗 ， 也 不 是 一 个 烟斗 的 图 像 ， 仅 仅 是 一 个 说 明文 | Ce epop ee 
字 ! 在 当前 的 上 下 文中 ， 这 个 图 强调 了 一 种 思想 ， 即 一 个 指向 “ee Neerew sm wenid 
对 象 的 引用 仅仅 是 一 个 引用 ， 引 用 不 是 对 象 本 身 。 人 
别名 。 带 有 引用 类 型 的 赋值 语句 可 以 创建 引用 类 型 的 第 二 个 副本 。 赋 值 语句 不 会 创建 
新 的 对 象 ， 只 是 对 现 有 对 象 的 另 一 个 引用 。 这 种 情况 被 称 为 别名 ， 两 个 变量 都 指向 同一 个 对 
象 。 别 名 的 效果 有 些 出 平 意料 ， 因 为 其 与 保存 内 置 类 型 值 的 变量 不 同 ， 你 一 定 要 正确 地 理解 
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它们 的 不 同 之 处 。 如 果 x 和 y 是 内 置 类 型 的 变量 ， 则 赋值 语句 x=y 是 将 y 的 值 复制 到 x。 而 
对 于 引用 类 型 ， 复 制 的 是 引用 (而 不 是 值 )。 
别名 是 Java 程序 中 常见 的 错误 来 源 ， 如 下 例 所 示 : 


Picture a = new Picture("mandrill.jpg"); 
Picture b = a; 

a.set(co1，row，color1);_ /一 次 更 新 
b.set(co1，row，color2); WU 再 次 更 新 


在 第 二 个 赋值 语句 之 后 ， 变 量 a 和 b 都 引用 相同 的 图 片 对 象 。 改 Color a; 1 ica6o sz 45); 
变 一 个 对 象 的 状态 会 影响 引用 该 对 象 的 别名 变量 的 所 有 代码 。 我 ”Color b = ai 
们 习惯 于 把 两 个 不 同 的 基本 类 型 变量 看 作 两 个 独立 的 变量 ,但 是 ey 
这 个 直觉 不 能 延续 到 引用 对 象 。 例 如 ， 如 果 前 面 的 代码 假定 a 和 
b 引用 不 同 的 图 片 对 象 ， 则 会 产生 错误 的 结果 。 这 样 的 别名 错误 。 a [841 | 引用 用 
在 对 引用 对 象 编程 经 验 不 足 的 人 编写 的 代码 中 十 分 常见 (这 个 人 。““ 上 | 漠 同 的 对 象 
常常 就 是 你 ， 所 以 请 注意 ! )。 “于 
不 可 变 类 型 。 正 是 出 于 上 述 原 因 ， 我 们 需要 能 够 定义 一 些 值 
不 能 改变 的 数据 类 型 。 如 果 数 据 类 型 值 一 旦 创建 就 不 能 改变 ,， 那 
么 该 数据 类 型 对 象 是 不 可 变 的 。 不 可 变 的 数据 类 型 中 所 有 类 型 对 
象 都 是 不 可 变 的 。 例 如 ，String 是 一 个 不 可 变 的 数据 类 型 ， 因 为 。” si 
客户 程序 没有 可 更 改 字符 串 字符 的 操作 接口 。 与 此 相对 的 ,可 变 。512 [sz 
数据 类 型 指 该 种 类 型 对 象 的 值 被 设计 为 可 变 的 。 例 如 ，Picture 是 
可 变数 据 类 型 ， 因 此 我 们 可 以 更 改 其 中 任意 像素 颜色 。 我 们 会 在 | | 
3.3 节 更 详细 地 讨论 不 变性 。 别名 
比较 对 象 。== 运算 符 应 用 于 引用 类 型 时 ， 会 检查 两 个 对 象 
引用 是 否 相等 ( 即 是 否 指向 同一 个 对 象 )。 这 不 同 于 检查 对 象 是 否 具有 相同 的 值 。 例 如 ， 请 
思考 以 下 代码 ; 
Color a = new Color(160, 82, 45); 


Color b = new Color(160, 82, 45); 
Color-c = b; 


现在 (a==b) 是 假 的 , (b==c) 是 真 的 ,但 是 当 你 测试 颜色 是 否 相同 时 ， 我 们 会 想 要 测试 
它们 的 值 是 否 相 同一 一 你 可 能 希望 测试 这 三 个 都 相等 。Java 没有 一 个 自动 的 机 制 来 测试 对 象 
的 值 是 否 相 等 ， 这 就 使 得 程序 员 有 机 会 (和 责任 ) 定义 一 个 名 为 equals() 的 自 定义 方法 来 实 
现 这 个 功能 ， 如 3.3 节 所 述 。 例 如 , Color 类 中 就 有 这 样 一 个 方法 ， 在 这 个 例子 中 , aequals(c) 
是 真 的 。String 类 型 已 经 实现 了 一 个 equals() 方法 ， 因 为 经 常 需 要 测试 两 个 字符 串 对 象 是 否 
具有 相同 的 值 (相同 的 字符 序列 )。 

传 值 。 当 调用 带 有 参数 的 方法 时 ，Java 中 的 效果 就 好 像 每 个 参数 都 显示 在 赋值 语句 的 右 
侧 ， 而 左边 是 相应 的 参数 名 称 。 也 就 是 说 ，Java 将 来 自 调 用 方 的 参数 值 的 副本 传递 给 方法 。 
如 果 参 数值 是 基本 类 型 ， 则 Java 会 传递 该 值 的 副本 ; 如 果 参 数值 是 一 个 对 象 引 用 ，Java 将 
传递 该 对 象 引 用 的 副本 。 这 种 设计 被 称 为 传 值 。 

这 种 设计 的 一 个 重要 结果 是 : 方法 不 能 直接 改变 调用 方 变量 的 值 。 对 于 基本 类 型 ， 这 
个 策略 是 我 们 所 希望 得 到 的 (两 个 变量 是 独立 的 ), 但 是 每 次 使 用 引用 类 型 作为 方法 参数 时 ， 
我 们 只 是 创建 了 一 个 别名 ， 因 此 需要 谨慎 。 例 如 ， 如 果 我 们 将 一 个 Picture 类 型 的 对 象 引用 


赭 色 
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传递 给 方法 ， 该 方法 不 能 改变 调用 方 的 对 象 引用 (比如 使 其 引用 其 他 图 片 )， 但 它 可 以 更 改 
对 象 的 值 ， 如 调用 set() 方法 来 改变 像素 的 颜色 。 

数组 是 对 象 。 在 Java 中 ， 每 个 非 基 本 数据 类 型 的 值 都 是 一 个 对 象 。 特 别 地 ， 数 组 也 是 
对 象 。 与 字符 串 一 样 ，Java 为 数组 上 的 一 些 操作 提供 特殊 的 语言 支持 : 声明 、 初 始 化 和 索引 。 
与 任何 其 他 对 象 一 样 ， 当 将 一 个 数组 传递 给 一 个 方法 时 ， 或 在 赋值 语句 的 右边 使 用 一 个 数组 
变量 时 ， 都 将 复制 数组 引用 ， 而 不 是 创建 数组 的 副本 。 数 组 是 可 变 对 象 一 一 这 个 规则 适用 于 
我 们 希望 方法 能 够 通过 重新 排列 元 素 的 值 来 对 数组 做 出 更 改 的 情况 ， 例 如 在 2.1 节 中 考虑 的 
exchange() 和 shuffle() 方法 。 

对 象 数组 。 数 组 元 素 可 以 是 任何 类 型 ， 从 main() 函数 实现 中 的 mp. 
args[ ] (一 个 字符 串 数组 )， 到 程序 3.1.9 中 的 Out 对 象 数 组 ， 我 们 已 经 La 
使 用 了 多 次 。 当 创建 一 个 对 象 数 组 时 ， 一 般 通 过 两 个 步骤 来 完成 : EE 一 人 

。 通过 使 用 new 和 方 括号 语法 创建 数组 。 

。 通过 使 用 new 调用 构造 函数 来 创建 数组 中 的 每 个 对 象 。 

例如 ,我 们 将 使 用 下 面 的 代码 来 创建 有 两 个 颜色 对 和 象 的 数组 : 323 站 二 5- 生 -a[ol 
324 | 611 | 一 a[1] 


a.length 


Color[] a = new Color[2]; 
a[0] = new Color(255, 255, 0); 
a[1] = new Color(160, 82, 45); 459 


当然 ，Java 中 的 对 象 数组 是 对 象 引用 的 数组 ， 而 不 是 对 象 本 身 。 461 | 0| 
如 果 对 象 很 大 ， 那 么 可 以 通过 无 须 移动 而 仅仅 引用 它们 来 大 大 提升 效 
率 。 如 果 对 象 很 小 ， 那么 每 次 需要 获取 某 些 信息 时 都 必须 使 用 引用 ， 
365] 效率 反而 很 低 。 6121 抽 | 82 
安全 指针 。 为 了 提供 操作 所 引用 的 数据 的 内 存 地 址 的 功能 ; 许多 
编程 语言 都 支持 指针 (类似 于 Java 引用 ) 作为 基本 数据 类 型 。 用 指针 | | 
编程 是 经 常 容易 出 错 的 部 分 ， 这 一 点 已 达成 共识 ， 所 以 为 指针 提供 的 
操作 需要 精心 设计 ， 以 帮助 程序 员 避 免 错 误 。Java 将 这 个 观点 推 向 
了 极致 (这 是 许多 现代 编程 语言 设计 者 所 青睐 的 )。 在 Java 中 ;只 有 一 种 方法 可 以 创建 引用 
(使 用 new)， 并 且 只 有 一 种 方法 来 操作 引用 (使 用 赋值 语句 )。 也 就 是 说 ， 程 序 员 唯一 能 对 引 
用 数据 类 型 做 的 操作 就 是 创建 并 复制 引用 。 在 编程 术语 中 ，Java 引用 被 称 为 安全 指针 ， 因 为 
Java 可 以 保证 每 个 引用 都 指向 特定 类 型 的 对 象 (而 不 是 一 个 任意 的 内 存 地 址 )。 过 去 编写 直 
接 操作 指针 的 代码 的 程序 员 认 为 Java 根本 没有 指针 ;但 是 人 们 仍然 在 讨论 非 安 全 指针 是 否 
应 该 存在 。 简 而 言 之 ， 当 使 用 Java 编程 时 ， 用 户 不 会 直接 操纵 内 存 地 址 ， 但 是 如 果 以 后 你 
需要 使 用 其 他 语言 来 实现 指针 的 话 ， 请 小 心 ! 
孤立 对 象 。 将 不 同 的 对 象 分 配给 一 个 引用 变量 的 功能 ， 可 能 导致 一 个 程序 创建 的 对 象 不 
再 被 引用 的 情况 。 如 下 图 的 三 个 赋值 语句 。 在 第 三 个 赋值 语句 之 后 ， 不 仅 a 和 b 引用 同一 个 
Color 对 象 (其 RGB 值 为 160、82 和 45 )， 而 且 最 初创 建 并 初始 化 给 b 的 对 象 将 不 再 被 任何 
变量 引用 。 唯 一 引用 该 对 象 的 变量 是 b， 但 第 三 条 赋值 语句 覆盖 了 该 引用 ， 结 果 没 有 任何 引 
用 指向 该 对 象 。 这 样 的 对 象 是 孤立 对 象 。 当 变量 超出 了 其 作用 范围 ， 其 指向 的 对 象 也 会 成 为 
孤立 对 象 ,Java 程序 员 一 般 不 会 关注 孤立 对 象 ， 因 为 系统 对 孤立 对 象 占用 的 内 存 会 自动 复 用 ， 
B66| 接 下 来 将 讨论 其 实现 机 制 。 
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内 存 管理 。 程 序 常常 创建 大 量 的 对 象 ， 但 是 在 特定 时 间 二 般 只 需要 使 用 其 中 少量 的 一 部 
分 。 因 此 ， 程 序 设计 语言 和 系统 需要 一 种 机 制 :在 需要 的 时 候 为 ”oo 。 
数据 类 型 值 分 配 内 存 ， 并 在 不 需要 时 (对 于 某 个 对 象 ， 即 在 其 成 ”3 = "ew colorG460，82, 45); 
为 孤立 对 象 的 时 候 ) 释放 内 存 。 对 于 基本 类 型 ， 内 存 管理 容易 实 P= 
现 ， 因 为 编译 时 就 已 知 所 有 内 存 分 配 所 需 的 信息 。Java (以 及 大 本 
多 数 其 他 系统 ) 在 声明 变量 时 为 其 在 内 存 空间 分 配 内 存 ， 并 在 变 
量 超出 作用 范围 时 释放 内 存 。 对 象 的 内 存 管理 更 为 复杂 : Java 知 。。。 | 是 | > 人 相 ， 
道 在 创建 对 象 (使 用 new) 时 为 对 象 分 配 内 存 ， 但 无 法 准确 知道 
何 时 释放 对 象 占用 的 内 存 ， 因 为 对 象 是 在 程序 的 执行 过 程 中 动态 
地 变 成 孤立 对 象 的 ， 只 有 那 时 才能 销毁 。 

内 存 汇 漏 3 在 许多 语言 (如 C 和 C++) 中 ， 程 序 员 负 责 分 配 
和 释放 内 存 ， 这 样 做 非常 麻烦 并 且 容 易 出 错 。 例如， 假设 一 个 程 
序 释放 了 一 个 对 象 所 占据 的 内 存 ， 但 是 在 稍 后 的 程序 中 继续 引用 
这 个 对 象 ， 而 此 时 ， 系 统 可 能 重新 分 配 了 相同 的 内 存 以 用 于 其 
他 用 途 ， 从 而 导致 各 种 错误 的 结果 。 当 程序 员 无 法 确保 孤立 对 g12 上 ez 
象 的 内 存 已 经 被 释放 时 ， 会 出 现 另 一 个 隐患 。 这 种 错误 被 称 为 。 83 | 4 
内 存 泄漏 ， 其 结果 可 能 导致 孤立 对 象 占 用 的 内 存 空间 不 断 增加 | | 
(这 些 内 存 却 不 能 被 重复 使 用 )。 这 将 导致 系统 性 能 下 降 ， 就 像 计 
算 机 的 内 存 “ 流 走 ” 了 一 样 。 读 者 也 许 经 历 过 系统 响应 越 来 越 
不 灵敏 而 重新 启动 计算 机 的 情况 ， 这 种 行为 发 生 的 一 个 常见 原因 就 是 某 个 应 用 程序 导致 了 
内 存 泄漏 。 

垃圾 回收 。Java 最 显著 的 特点 之 一 是 能 够 自动 管理 内 存 。Java 可 以 跟踪 孤立 对 象 ， 回 
收 其 占用 的 内 存 空间 到 空闲 的 内 存 池 ， 能 让 程序 员 从 管理 内 存 的 责任 中 解放 出 来 。 这 种 回收 
内 存 的 方式 被 称 为 垃圾 回收 。Java 的 安全 指针 策略 使 其 能 够 高 效 地 自动 执行 这 一 操作 。 程 序 
员 仍然 在 争论 “自动 垃圾 回收 的 开销 ”与 “不 必 担 心 内 存 管理 的 便利 性 ”之 间 的 利弊 权衡 问 
题 。 本 书 给 出 的 结论 是 : 当 在 Java 中 编程 时 ， 和 你 不 必 编 写 代码 来 分 配 和 释放 内 存 ， 但 是 如 
果 以 后 你 在 其 他 语言 中 这 样 做 ， 请 小 心 ! 

作为 参考 ,我们 在 下 面 的 表格 中 总 结 了 我 们 在 本 节 中 讨论 过 的 例子 。 选 择 这 些 例子 是 为 
了 帮助 读者 理解 数据 类 型 和 面向 对 象 程序 设计 的 基本 特征 。 

二 个 数据 类 型 是 一 系列 值 和 定义 在 这 些 值 上 的 一 组 操作 的 集合 。 使 用 基本 数据 类 型 ， 可 
以 处 理 少量 简单 的 值 。 字 符 串 (String)、 颜 色 (Color)、 图 片 (Picture) 和 输入 /输出 流 (In， 
Out) 是 高 级 数据 类 型 ， 展 示 了 数据 抽象 的 广泛 应 用 。 使 用 一 个 数据 类 型 时 无 须 理解 其 具体 
实现 。 每 种 数据 类 型 (Java 库 中 有 数 百 种 ， 在 后 续 章节 中 将 





学 习 创建 自 定义 数据 类 型 ) 通过 API (应 用 程序 编程 接口 ) 提 ” 2 
供 其 使 用 信息 。 客 户 程序 创建 对 象 并 赋予 对 象 相应 数据 类 型 La 
的 值 ， 以 及 调用 实例 方法 操作 这 些 值 。 我 们 使 用 第 1 章 和 第 iino i 
2 章 中 学 到 的 基本 语句 和 控制 结构 编写 客户 程序 ， 但 是 现在 ”mn 析 才 i 
我 们 有 能 力 处 理 各 种 各 样 的 数据 类 型 ， 而 不 仅仅 基 已 经 习惯 。 ou 输出 流 
的 基本 数据 类 型 。 有 了 更 多 的 经 验 ， 读 者 会 发 现 使 用 各 种 数 。 “Draw 给 图 


据 类 型 的 能 力 将 拓展 程序 设计 的 新 视野 。 本 节 中 数据 类 型 的 总 结 
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比 起 不 使 用 抽象 数据 类 型 的 情况 ， 精 心 设计 和 实现 的 数据 类 型 可 以 使 客户 程序 更 清晰 简 
洁 ， 易 于 开发 和 维护 。 本 节 实 现 的 客户 程序 有 力 地 证 明了 这 一 点 。 另 外 ， 我 们 将 在 下 一 节 学 
习 到 ， 实 现 数 据 类 型 其 实 就 是 读者 已 经 学 习 的 基本 编程 技巧 的 简单 应 用 。 特 别 是 解决 大 型 和 
复杂 的 应 用 程序 就 变 成 为 应 用 程序 设计 适合 的 数据 并 定义 数据 上 的 操作 的 过 程 ， 然 后 编写 程 
序 的 过 程 就 是 这 些 理念 的 直接 体现 。 一 旦 学 会 了 这 种 实现 方法 ,读者 可 能 会 惊讶 为 什么 有 的 
程序 员 在 开发 大 型 程序 的 过 程 中 竟然 不 使 用 数据 抽象 。 
问答 环节 

问 : 为 什么 区 分 内 置 (基本 ) 类 型 和 引用 类 型 ? 

答 : 因为 性 能 。Java 提供 了 与 内 置 类 型 相对 应 的 引用 类 型 Integer、Double 等 ， 并 且 可 
能 会 被 那些 喜欢 忽略 区 别 (详情 参见 3.3 节 ) 的 程序 员 所 使 用 。 内 置 类 型 更 接近 于 计算 机 硬 
件 支 持 的 数据 类 型 ， 因 此 使 用 它们 的 程序 通常 运行 得 更 快 ， 并 且 比 使 用 相应 引用 类 型 的 程序 
消耗 更 少 的 内 存 。 

问 : 如 果 在 创建 对 象 时 忘记 使 用 new， 会 发 生 什么 情况 ? 

答 : 对 于 Java 来 说 ， 看 起 来 像 是 你 想 调 用 一 个 带 有 返回 对 象 类 型 的 静态 方法 。 既 然 程序 
没有 定义 这 样 一 个 方法 ， 那 么 错误 信息 就 和 引用 一 个 未 定义 的 符号 一 样 。 如 果 编 译 如 下 代码 


Color sienna = Color(160, 82, 45); 
将 得 到 这 样 的 错误 信息 : 


cannot find symbol]l 
symbol : method Color(int,int,int) 


构造 函数 不 提供 返回 值 (它们 的 定义 中 也 没有 返回 类 型 )， 它 们 只 能 通过 new 关键 字 调 
用 。 如 果 向 构造 函数 或 方法 提供 了 错误 的 参数 数量 ， 则 会 得 到 与 刚才 一 样 的 错误 消息 。 

问 : 为 什么 我 们 可 以 用 函数 调用 StdOut.println(x) 来 打印 对 象 x， 而 不 是 StdOut. 
println(x.toString()) ? 

答 : 这 是 一 个 很 好 的 问题 。 后 者 能 够 工作 正常 ， 但 是 Java 的 机 制 可 以 自动 调用 toString() 
方法 ， 为 我 们 省 下 一 些 工 作 。 在 3.3 节 中 ， 我们 将 讨论 Java 实现 这 一 机 制 使 用 的 方法 。 

问 : =、==、equals( 之 间 的 区 别 是 什么 ? 

答 : 单个 等 号 (=) 是 赋值 语句 ， 你 一 定 熟悉 这 一 点 。 双 等 号 (==) 是 一 个 二 元 运算 符 ， 
用 于 检查 两 个 操作 数 是 否 相 同 。 如 果 操 作 数 是 内 置 类 型 ， 那么 当 它 们 具有 相同 的 值 时 结果 为 
真 ， 否 则 为 假 。 如 果 操 作 数 是 对 象 引用 ,那么 当 引 用 同一 个 对 象 时 ， 则 结果 为 真 ， 否 则 为 
假 。 也 就 是 说 ,我 们 使 用 == 来 测试 对 象 的 标识 是 否 相 等 。Java 的 每 个 数据 中 都 包含 一 个 方 
法 equals()， 以 便 实现 为 用 户 提 供 测 试 两 个 对 象 是 否 具 有 相同 值 的 能 力 。 请 注意 ，(a==b) 意 
味 着 a.equals(b)， 反 之 则 不 成 立 。 

问 : 如 何 将 一 个 数组 作为 参数 传递 给 一 个 函数 ， 并 且 使 得 函数 无 法 改变 数组 中 元 素 
的 值 ? 

答 : 没有 直接 的 方法 能 够 实现 这 个 功能 一 一 因为 数组 是 可 变 的 。 在 3.3 节 中 ， 我们 将 学 
习 如 何 通过 构建 封装 数据 类 型 并 传递 该 类 型 的 对 象 引用 来 实现 想 要 的 效果 (请 参见 程序 3.3.3 
中 的 Vector)。 

问 : “如 果 在 创建 对 象 数 组 时 忘记 使 用 new， 会 发 生 什么 ? 
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答 : 程序 需要 使 用 new rpm 因此 创建 一 个 包含 个 对 象 的 数组 时 ,需要 使 
用 nt1 次 new: 对 数组 使 用 一 次 ,对 nn 个 对 象 每 个 使 用 一 次 。 如 果 忘 记 创建 数组 : 


Color[] colors; 
colors[0] = new Color(255, 0, 0); 


将 会 得 到 与 尝试 将 值 分 配给 未 初始 化 的 变量 时 相同 的 错误 消息 : 


variable colors might not have been initialized 
colors[0] = new Color(255, 0, 0); 
A 


相反 ， 如 果 在 数组 中 创建 对 象 时 忘记 使 用 new， 然 后 尝试 使 用 它 来 调用 方法 


Color[] colors = new Color[2]; 
int red = colors[0] .getRed(); 


将 会 得 到 一 个 空 指针 异常 。 一 般 来 说 ， 回 答 这 些 问 题 的 最 好 方法 是 自己 编写 和 编译 这 些 代 
码 ， 然 后 尝试 解释 Java 的 错误 消息 。 这 样 做 可 能 会 帮助 我 们 更 快 地 识别 错误 。 

问 : 请 问 哪里 可 以 找到 有 关 Java 如 何 实现 引用 和 垃圾 回收 的 更 多 细节 ? 

答 : 一 个 Java 系统 可 能 与 男 一 个 完全 不 同 。 例 如 ,一 个 常用 的 方案 是 使 用 一 个 指针 (机 
器 地 址 ) ; 另 一 个 方案 是 使 用 句柄 (指向 指针 的 指针 )。 前 者 提供 更 快速 的 数据 访问 ; 后 者 便 
于 垃圾 回收 。 

问 : 为 什么 三 原色 是 红 、 绿 、 蓝 而 不 是 红 、 黄 、 蓝 ? 

答 : 理论 上 讲 ,， 任何 三 种 包含 每 个 主 颜 色 某 些 分 量 的 颜色 都 可 以 起 作用 ,但 目前 为 止 ， 
广泛 使 用 的 两 种 不 同 的 颜色 模型 : 一 种 (RGB) 在 电视 屏幕 、 计 算 机 显示 器 和 数码 相机 上 可 
产生 良好 的 色彩 ， 另 一 种 (CMYK) 通常 用 于 印刷 (参见 练习 1.2.32 ) CMYK 包括 黄色 ( 青 
色 、 品 红色 、 黄 色 和 黑色 )。 两 种 不 同 的 颜色 模型 都 有 各 自 的 实用 性 ， 对 于 印刷 ， 因 为 印刷 
油墨 吸收 颜色 ; 当 存 在 两 种 不 同 颜 色 的 油墨 时 ， 吸收 的 颜色 越 多 反射 的 颜色 越 少 。 与 之 相对 
的 ， 视 频 显示 器 会 发 出 颜色 ， 所 以 存在 两 个 不 同 颜色 的 像素 时 ,会 反射 更 多 的 颜色 。 

问 : import 语句 的 目的 究竟 是 什么 ? 

答 : 很 简单 : 它 只 是 为 了 让 你 少 输入 一 些 字 。 例 如 ， 在 程序 3.1.2 中 , 它 使 用 户 可 以 在 
代码 中 的 任何 地 方 使 用 Color， 而 不 用 输入 java.awt.Color。 

问 : 在 Grayscale 程序 (程序 3.1.4 ) 中 ,分 配 和 释放 数 千 个 Color 对 象 是 否 有 任何 问题 ? 

答 : 所 有 的 编程 语言 结构 都 有 一 定 的 代价 。 这 种 情况 下 的 开销 是 合理 的 ， 因 为 分 配 
Color 对 象 的 时 间 与 绘制 图 像 的 时 间 相 比 是 微小 的 。 

问 : 为 什么 String 方法 调用 s.substring(i，j) 返回 从 索引 i 开始 并 以 j-1 (而 不 是 j) 结束 
的 s 的 子 串 ? 

答 : 为 什么 数组 a[] 的 索引 从 0 到 a.lengthO0-1， 而 不 是 从 1 到 长 度 ? 编 程 语言 设计 师 做 
出 选择 ; 我 们 接受 这 个 规则 。 这 个 规则 的 一 个 很 好 的 结果 是 ， 提 取 的 子 串 的 长 度 是 j-i。 

问 : 通过 值 传递 参数 和 通过 引用 传递 参数 之 间 有 什么 区 别 ? 

答 : 通过 值 传递 ， 当 你 调用 一 个 带 参数 的 方法 时 ， 每 个 参数 都 被 计算 出 来 ， 并 将 结果 值 
副本 传递 给 该 方法 。 这 意味 着 ， 如 果 方 法 直接 修改 参数 变量 ， 那 么 这 个 修改 对 于 调用 者 是 不 
可 见 的 。 通过 引用 传递 ， 每 个 参数 的 内 存 地 址 被 传递 给 方法 。 这 意味 着 如 果 一 个 方法 修改 了 

一 个 参数 变量 ， 这 个 修改 对 于 调用 者 是 可 见 的 。 从 技术 上 讲 ，Java 是 一 种 纯粹 的 按 值 传 参 语 
言 ， 其 中 的 值 可 以 是 内 置 类 型 值 或 对 象 引 用 。 因 此 ， 当 你 将 一 个 内 置 类 型 值 传递 给 方法 时 ， 
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该 方法 将 无 法 修改 调用 方法 中 的 相应 值 ; 当 你 传递 一 个 方法 的 对 象 引 用 时 ， 方 法 不 能 修改 对 
象 引 用 〈 比 如 说 引用 一 个 不 同 的 对 象 )， 但 是 其 可 以 改变 底层 对 象 通过 使 用 对 象 引 用 来 调用 
对 象 的 一 个 方法 )。 出 于 这 个 原因 ， 一 些 Java 程序 员 使 用 术语 “通过 对 象 引用 传递 ”来 表示 
Java 的 引用 类 型 参数 传递 的 方法 。 

问 : String 和 Color 中 equals( 方法 的 参数 是 Object 类 型 的 。 人 参数 不 应 该 分 别 是 String 
类 型 和 Color 类 型 吗 ? 

答 : 不 。 在 Java 中 ，equals() 是 一 个 特殊 的 方法 ， 它 的 参数 类 型 应 该 始终 是 Object。 这 
是 Java 用 于 支持 equals() 方法 的 继承 机 制 的 设计 ， 我 们 将 在 3.3 节 讨 论 这 一 点 。 现 在 ， 我 们 
可 以 放心 地 忽略 这 种 区 别 。 

问 : 为 什么 图 像 处 理 数据 类 型 名 为 Picture 而 不 是 Image ? 

答 : 因为 已 经 有 一 个 名 为 Image 的 内 置 Java 库 。 


练习 


3.1.1 请 编写 一 个 程序 ， 程序 需要 输入 一 个 double 类 型 的 命令 行 参数 w， 然 后 创建 4 个 带电 荷 值 为 
1.0 的 Charge 对 象 ， 分 别 位 于 位 置 点 (0.5,0.5 ) 的 上 、 下 、 左 、 右 四 个 方向 上 , 与 (0.5, 0.5) 
的 距离 为 w， 请 输出 位 置 点 (0.25,0.5 ) 的 电势 。 
3.1.2 ”编写 一 个 程序 ， 程 序 命令 行 获取 0 到 255 之 间 的 3 个 整数 ， 分 别 代表 一 种 颜色 的 红色 : 绿色 和 
蓝 色 值 ， 然 后 创建 并 显示 一 幅 256X256 图 像 ， 用 该 颜色 填充 图 像 中 的 像素 。 
3.1.3 ”修改 程序 AlbersSquares (程序 3.1.2)， 实 现 如 下 功能 : 程序 须 输入 9 个 命令 行 参数 ， 指 定 3 种 
颜色 ， 然 后 绘制 6 个 正方 形 ， 标 识 出 所 有 的 .Albers 正方 形 ， 其 中 ,大 的 正方 形 采 用 一 种 颜色 绘 
制 ， 小 的 正方 形 则 采用 男 一 种 颜色 绘制 。 
3.1.4 ”请 编写 一 个 程序 ， 程序 从 命令 行 参数 读 入 一 个 文件 名 ， 用 于 指定 一 个 灰 度 图 像 文件 ， 使 用 
StdDraw 绘制 该 灰 度 图 像 256 个 灰 度 值 出 现 频率 的 直方 图 。 
3.1.5 ”编写 一 个 程序 二 以 图 像 文件 的 名 称 为 命令 行 参数 ， 实 现 图像 水 平 翻转 。 
3.1.6 “编写 一 个 程序 ， 将 图 像 文 件 的 名 称 作为 命令 行 参数 ， 创 建 3 个 图 片 对 象 ， 一 个 只 包含 原始 图 像 
的 红色 分 量 ， 一 个 只 包含 绿色 分 量 ， 另 一 个 只 包含 蓝 色 分 量 ， 并 显示 三 幅 图 片 。 
3.1.7 编写 一 个 程序 ， 将 图 像 文 件 的 名 称 作 为 命令 行 参数 ， 计 算出 该 图 像 中 能 够 框 住所 有 非 白 色 像 素 
的 最 小 包围 框 (假设 包围 框 是 边 平行 于 x 轴 和 y 轴 的 矩形 )， 输 出 该 框 的 左下 角 和 右上 和 角 的 像素 
坐标 。 
3.1.8 ”编写 一 个 程序 ， 程 序 需 要 输入 两 个 命令 行 参数 : 一 个 图 像 文 件 名 和 位 于 图 像 之 内 的 一 个 和 矩形 的 
像素 坐标 。 从 标准 输入 读 取 若 干 Color 值 (颜色 值 使 用 3 个 整数 表示 )。 请 设计 一 个 过 滤器 ， 从 
输入 的 Color 值 中 ， 筛 选 并 输出 与 矩形 框 中 所 有 的 前 景色 / 背景 色相 兼容 的 颜色 (此 类 过 滤器 可 
用 于 为 文本 选择 一 种 颜色 以 标记 一 幅 图 像 )。 
3.1.9 请 编写 一 个 函数 isvalidDNA()， 输 入 一 个 字符 串 参 数 ， 当 且 仅 当 字符 串 参 数 完全 由 字符 A、C、 
T 和 G 组 成 时 ， 返回 True。 
3.1.10 ”请 编写 一 个 函数 complementWC()， 输入 一 个 DNA 字符 串 参 数 ， 返 回 其 Watson-Crick- 碱 基 互 
补 ， 即 A 和 TI 互 换 、C 和 6G 互 换 s 

3.1.11 请 编写 一 个 函数 isWatsonCrickPalindrome()， 输 入 一 个 DNA 字符 串 参 数 ， 如 果 DNA 字符 串 
是 Watson-Crick 互补 碱 基 回 文 的 形式 ,程序 返 回 True; 否则 返回 Falses Watson-Crick 互补 碱 
基 回 文 是 一 个 DNA 序列 ， 它 与 Watson-Crick 互补 碱 基 序列 的 逆序 形式 相同 。 
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请 编写 一 个 程序 ， 检 查 一 个 ISBN 号 是 否 有 效 (详情 参 见 练习 1.3.35 )。 请 注意 ISBN 号 可 能 会 
在 任意 位 置 出 现 连 字符 (-)。 
下 面 代码 片段 的 输出 是 什么 ? 


String stringl = "hello"; 
String string2 = stringl; 
stringl = "world"; 
StdOut.printin(stringl); 
StdOut.printin(string2); 


下 面 代码 片段 的 输出 是 什么 ? 


String s = "Hello World"; 
s.toUpperCase() ; 
s.substring(6, 11); 
StdOut.printin(s); 

答案 :“ Hello World”。 字 符 串 对 象 是 不 可 变 对 象 ， 每 个 字符 串 方法 都 会 返回 一 个 新 的 
String 对 象 以 及 合适 的 值 (但 不 会 改变 用 于 调用 方法 的 原 字 符 串 的 值 )。 此 代码 忽略 返回 的 对 
象 ， 只 是 打印 原始 字符 串 。 要 打印 “WORLD”， 用 s=s.toUpperCase() 和 s= s.substring(6,11) 
替换 第 二 个 和 第 三 个 语句 。 
对 于 一 个 字符 串 s 和 一 个 字符 串 t,t 中 的 字符 首尾 相 接 ， 经 过 若干 次 循环 移动 后 能 够 与 s 匹配 ， 
那么 就 说 s 是 t 的 循环 移 位 。 例 如 ,ACTGACG 是 TGACGAC 互 为 循环 移 位 。 检 测 这 种 情况 
在 基因 组 序列 的 研究 中 是 重要 的 。 编 写 一 个 程序 ， 检 查 两 个 给 定 的 字符 串 s 和 + 上 是否 互 为 循环 
移 位 。 提 示 : 解决 方案 中 可 能 要 同时 使 用 indexOf() 和 字符 串 连接 。 
给 定 代 表 一 个 网 站 URL 的 字符 串 ， 请 编写 代码 片段 以 确定 其 顶级 域名 。 例 如 ， 本 书 官网 
cs.princeton.edu 的 顶级 域名 是 edu。 
编写 一 个 以 域名 作为 参数 的 静态 方法 ， 返 回 其 反 向 域名 (颠倒 点 之 间 的 字符 串 顺序 )。 例 如 ， 
cs.princeton.edu 的 反 向 域名 是 edu.princeton.cs。 此 计算 对 于 Web 日 志 分 析 非 常 有 用 ( 见 练 习 
4.2.36 )。 


下 面 的 递归 函数 返回 什么 ? 
public static String mystery(String s) 
{ 
int n = s.lengthO); 
if (n <= 1) return s; 
String a = s.substring(0, n/2); 
String b = s.substring(n/2, n); 
return mystery(b) + mystery(a); 
} 


为 PotentialGene (程序 3.1.1 ) 写 一 个 测试 用 户 程 序 ， 它 使 用 字符 串 作为 命令 行 参数 ， 并 检测 
它 是 否 是 一 个 潜在 基因 。 

写 另 一 个 版 本 的 PotentialGene (程序 3.1.1 )， 在 一 个 长 的 DNA 字符 串 中 找到 包含 在 子 字符 串 
中 的 所 有 潜在 基因 。 添 加 一 个 命令 行 参数 以 允许 用 户 指定 潜在 基因 的 最 小 长 度 。 

编写 一 个 从 输入 流 中 读 取 文本 并 将 其 输出 到 输出 流 的 过 滤器 ， 删 除 仅 包含 空白 的 行 。 
编写 一 个 程序 ， 该 程序 将 一 个 起 始 字符 串 和 一 个 结束 字符 串 作 为 命令 行 参数 ， 并 打印 以 起 始 
字符 串 开始 、 结 束 字符 串 结束 的 所 有 子 字符 串 。 注 意 ; 考虑 重 番 的 情况 ! 

修改 StockQuote (程序 3.1.8 )， 以 支持 在 命令 行 上 输入 多 个 股票 号 码 。 
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用 于 Split (程序 3.1.9 ) 的 示例 文件 DJIA.csv 列 出 了 其 自 记 录 以 来 每 天 道琼斯 股票 市 场 平均 价 
格 的 日 期 、 最 高 价 、 交 易 量 和 最 低 价 。 从 本 书 官网 下 载 这 个 文件 ， 编 写 一 个 程序 ， 创 建 两 个 
Draw 对 象 ， 一 个 用 于 价格 ， 另 一 个 用 于 数量 ， 并 以 从 命令 行 接收 的 参数 比例 绘制 股票 价格 和 
成 交 量 图 。 

编写 一 个 程序 Merge， 程 序 从 命令 行 接收 若干 参数 : 一 个 分 隔 符 字 符 串 和 任意 数量 的 文件 名 。 
以 指定 的 字符 串 作 为 分 隔 符 ， 拼 接 每 个 文件 相应 的 行 的 内 容 ， 并 将 结果 写 人 标准 输出 ， 从 而 
实现 Split (程序 3.1.9 ) 的 相反 操作 。 

查找 一 个 发 布 本 地 区 当前 气温 的 网 站 ， 并 写 一 个 Web 信息 抓 取 程序 Weather， 输 入 “java 
weather ”后跟 邮政 编码 ， 可 获取 邮政 编码 所 在 地 区 的 天 气 预 报 。 

假设 a[ ] 和 bf ] 都 是 由 数 百 万 个 整数 组 成 的 整数 数组 。 下 面 的 代码 是 做 什么 的 ， 需 要 多 长 
时 间 ? 


int[] temp = a; a = b; b = temp; 


答案 : 它 交 换 数组 ,但 它 通 过 复制 对 象 引 用 来 实现 这 一 功能 ， 所 以 不 需要 拷贝 数 百 万 个 值 。 
描述 以 下 函数 的 效果 。 


public void swap(Color a, Color b) 
{ 

Color temp = a; 

a=b; 

b = temp; 
} 
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图 片 文件 格式 。 编 写 一 个 静态 方法 库 RawPicture， 提 供 read() 和 write( 方法 用 于 读 取 和 保存 
文件 中 的 图 片 。write() 方法 将 一 个 图 片 对 象 和 一 个 文件 的 名 称 作为 参数 ， 将 图 片 转换 为 指定 
的 文件 写 和 信人， 使 用 以 下 格式 输出 : 如 果 图 片 是 wXh， 则 输出 w， 然 后 h， 最 后 输出 wXh 个 代 
表 像 素颜 色 值 的 整数 三 元 组 ， 按 行 优先 顺序 输出 。read() 方法 将 图 片 文件 的 名 称 作为 参数 ,并 
通过 从 指定 文件 中 读 取 数据 来 返回 一 个 图 片 对 象 ， 格 式 如 上 所 述 。 注 意 : 所 占用 的 磁盘 空间 比 
图 像 文件 要 大 得 多 ， 因 为 标准 图 像 文件 格式 通常 会 压缩 这 些 信息 ， 所 以 不 会 占用 太 多 的 空间 。 
声音 可 视 化 。 使 用 StdAudio 和 Picture 对象 编写 一 个 程序 ， 在 播放 音乐 的 同时 创建 一 个 有 趣 的 
二 维 颜 色 可 视 化 文件 。 请 读者 发 挥 自己 的 创意 ! 

Kamasutra 密码 。 编 写 一 个 过 滤器 程序 KamasutraCipher， 它 将 两 个 字符 串 作 为 命令 行 参数 ( 密 
钥 字 符 串 )， 然 后 从 标准 输入 中 读 取 若干 字符 串 (用 空格 分 隔 )， 按 照 密 钥 字 符 串 指定 替换 规 
则 替换 输入 的 每 个 字母 ， 并 将 结果 输出 到 标准 输出 。 这 个 操作 是 已 知 最 早 的 密码 系统 的 基础 。 
密 钥 字符 串 的 条 件 是 它们 必须 具有 相同 的 长 度 ， 并 且 标 准 输入 中 的 所 有 字母 必须 包含 在 其 中 
一 个 字符 串 中 。 例 如 ， 如 果 两 个 密 钥 字符 串 是 THEQUICKBROWN 和 FXJMPSVRLZYDG,， 
那么 我 们 得 到 表格 


这 张 表 告诉 我 们 ， 当 把 标准 输入 过 滤 到 标准 输出 时 ， 应 该 用 F 代 蔡 T、T 代 蔡 F、H 代替 X、 
X 代 替 互 等 。 通 过 将 每 个 字符 替换 为 对 应 字符 ， 实 现 信 息 的 加 密 。 例 如 ， 消 息 “MEET AT 
ELEVEN ”被 编码 为 “QJJF BF JKJCJG”。 接 收 消息 的 人 可 以 使 用 相同 的 密 钥 来 解密 明文 。 
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验证 密码 的 安全 性 。 编 写 一 个 将 字符 串 作为 参数 的 函数 ， 如 果 满 足以 下 条 件 则 返回 真 ， 否 则 
返回 假 : 
。 至 少 8 个 字符 。 
。 包含 至 少 一 个 数字 (0 一 9 )。 
。 包含 至 少 一 个 大 写字 母 。 
。 包含 至 少 一 个 小 写字 和 母 。 
。 包含 至 少 一 个 既 不 是 字符 也 不 是 数字 的 字符 。 
类 似 的 检测 通常 用 于 Web 密码 验证 。 
颜色 研究 。 编 写 一 个 程序 ， 实 现 右 图 颜色 研究 结果 的 显 
示 。 图 中 展示 了 Albers 正方 形 ， 对 应 256 级 别 蓝 色 (每 
行 从 左 到 右 按照 从 蓝 色 到 白色 渐变 ) 和 灰 度 (每 列 从 上 到 
下 按 从 黑色 到 白色 渐变 )， 而 这 些 也 正 是 印刷 本 书 英文 原 
书 时 使 用 的 颜色 。 
粮 。 香 农 灶 用 于 表示 输入 数据 的 信息 量 ， 在 信息 理论 和 
数据 压缩 中 起 着 基石 的 作用 。 给 定 一 个 包含 个 字符 的 
字符 串 ， 设 大 为 字符 c 出 现 的 频率 。p。=fs/n 是 c 在 一 个 随 
机 的 字符 串 中 的 频率 的 估计 ,信息 炉 定 义 为 字符 串 中 所 一 个 颜色 研究 
有 字符 的 pclog; ps 之 和 。 信 息 人 被 用 于 度量 一 个 字符 串 的 
信息 量 : 如 果 每 个 字符 出 现 次 数 相 同 ， 则 信息 灶 为 最 小 值 。 编 写 一 个 程序 ， 将 一 个 文件 名 作 
为 命令 行 参数 ， 并 输出 该 文件 的 焙 。 

分 别针 对 你 经 常 阅读 的 一 个 网 页 、 最 近 撰写 的 一 篇 论文 、 从 网 站 上 查找 到 的 果 蝇 基因 组 ， 
运行 并 测试 该 程序 。 
平 铺 5 编写 一 个 程序 ， 该 程序 以 图 像 文件 的 文件 名 和 两 个 整数 六 和 无 作 为 命令 行 参数 ， 并 创 
建 一 个 mXn 的 图 像 平 铺 。 


旋转 30 度 洲 涡 过 滤器 波形 过 滤器 毛 玻 璃 过 滤器 





图 像 过 滤器 


旋转 过 滤器 。 编 写 一 个 程序 ， 其 中 采用 两 个 命令 行 参数 (图 像 文件 名 称 和 一 个 实数 0)， 并 将 
图 像 逆 时 针 旋转 9 角度。 为 了 实现 旋转 ， 将 源 图 像 中 每 个 像素 ( s;,s)) 的 颜色 复制 到 目标 像素 ， 
目标 像素 的 坐标 (ti,4) 由 以 下 公式 给 出 : 

三 (Srci)cos 0 —(s;—c))sin 0 +ci 

大 (S 一 Ci)Sin 0 —(s;—c))cos 0 +c; 

其 中 (cscj) 是 图 像 的 中 心 点 。 

淡 涡 过 滤器 。 创 建 一 个 洲 涡 效果 。 类 似 于 旋转 ,但 不 同 之 处 在 于 ， 角 度 的 改变 是 像素 到 中 心 
距离 的 函数 。 使 用 与 前 面 练习 中 相同 的 公式 , 但 9 是 (si,s)) 的 函数 : 9 的 值 是 (5/256 乘 以 该 
像素 到 中 心 点 的 距离 。 
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3.1.38 波形 过 滤器 。 通 过 将 源 图 像 中 每 个 像素 ( sis)) 的 颜色 复制 到 一 个 目标 像素 (ti,4) 中 ， 写 出 一 
个 像 前 两 个 练习 中 那样 的 过 滤器 ， 从 而 产生 波浪 效果 ， 其 中 
is% 和 二 9%+20 sin(2m sj/64)。 添 加 代码 以 将 振幅 (图 中 为 20 ) 
和 频率 (图 中 为 64 ) 作为 命令 行 参 数 。 用 不 同 的 参数 值 运行 
测试 程序 。 

3.1.39 ” 毛 玻璃 过 滤器 。 编 写 一 个 程序 ,将 图 像 文件 的 名 称 作为 命令 
行 参数 ， 并 应 用 毛 玻璃 过 滤器 : 将 每 个 像素 p 设 置 为 随机 相 
邻 像素 的 颜色 (邻居 像素 的 坐标 点 位 置 距离 p 的 坐标 点 位 置 
在 5 个 像素 之 内 )。 

3:1.40 幻灯 片 放映 。 编 写 一 个 程序 ， 将 多 个 图 像 文件 的 名 称 作为 命 % java zoom boyjp9 ,5 .5 .5 
令 行 参数 ， 并 以 幻灯 片 的 形式 显示 (每 两 秒 一 次 )， 在 图 像 之 
间 使 用 黑色 淡 入 淡出 效果 ， 即 图 像 退出 时 褪色 为 黑色 ， 然 后 
由 黑色 褪色 为 下 一 张 图 像 。 

3.1.41 变形 。 本 书 中 讲 到 的 Fade 程序 的 示例 图 像 在 垂直 方向 上 没有 
对 齐 (mandrill 中 嘴 的 位 置 比 Darwin 中 嘴 的 位 置 低 很 多 )。 给 
Fade 程序 在 垂直 维度 中 添加 一 个 变化 ， 使 得 过 渡 的 效果 更 加 
平滑 。 

3.1.42 ”数码 变焦 。 编 写 程序 Zoom， 将 图 像 文 件 的 名 称 和 三 个 数字 
s、xX 和 y 作 为 命令 行 参 数 ， 并 显示 输入 图 像 某 一 部 分 的 放大 
结果 。 数 字 范 围 都 在 0 和 1 之 间 ， 其 中 s 为 缩放 的 比例 因子 ， 
(x,y) 作为 输出 图 像 中 心 点 的 相对 坐标 。 使 用 此 程序 可 放大 计 
算 机 上 亲属 或 宠物 的 照片 (如果 你 的 照片 来 自 旧 手机 或 相机 ， 
照片 放 得 太 大 后 就 会 出 现 很 多 不 自然 的 瑕 症 )。 


3.2 创建 数据 类 型 


原则 上 ， 仅 使 用 内 置 的 8 种 基本 数据 类 型 就 可 以 编写 所 有 的 程序 。 但 是 ， 正 如 上 一 节 所 
述 ， 在 更 高 的 抽象 层次 上 编写 程序 会 更 加 便利 。 因 此 ，Java 的 语言 标准 和 扩展 库 中 定义 了 各 种 
数据 类 型 。 尽 管 如 此 ， 我 们 肯定 不 能 指望 Java 包含 了 所 有 我 们 可 能 使 用 的 数据 类 型 ， 所 以 能 
够 定义 自己 的 数据 类 型 就 显得 十 分 必要 。 本 节 介 绍 如 何 使 用 Java 的 类 (class) 构建 数据 类 型 。 

使 用 Java 类 实现 数据 类 型 ， 与 实现 一 个 包含 若干 函数 的 静态 方法 库 并 没有 很 大 区 别 ， 主 要 
区 别 在 于 我 们 这 次 需要 将 方法 实现 与 数据 相关 联 。API 指定 了 需要 实现 的 构造 函数 和 实例 方法 ， 
但 是 用 户 可 以 自由 选择 任何 方便 的 方式 来 实现 。 为 了 巩固 基本 概念 ， 我 们 首先 实现 3.1 节 中 介 
绍 的 带电 粒子 的 数据 类 型 。 接 下 来 ， 我 们 通过 一 系列 示例 (从 复数 到 股票 账户 ， 包 括 后 续 章节 
中 将 使 用 的 一 些 软 件 工具 ) 来 说 明 创 建 数 据 类 型 的 过 程 。 实 用 的 客户 代码 是 任何 数据 类 型 的 价 
值 的 最 好 证 明 ， 所 以 我 们 将 讨论 一 些 客户 程序 示例 ， 包 括 描述 著名 而 迷人 的 Mandelbrot 集合 。 

定义 一 个 数据 类 型 的 过 程 被 称 为 数据 抽象 。 我 们 关注 数据 并 实现 对 这 些 数据 的 操作 。 在 
计算 中 应 当 清 晰 地 分 离 数据 和 相关 的 计算 任务 。 对 物理 对 象 或 者 熟悉 的 数学 概念 进行 抽象 建 
模 是 简单 而 且 实 用 的 , 但 是 数据 抽象 的 强大 之 处 在 于 它 允 许 我 们 对 任何 可 以 精确 描述 的 东西 
进行 建 模 。 读 者 一 旦 熟悉 这 种 编程 风格 的 经 验 ， 就 会 发 现 数 据 抽象 的 使 用 可 以 帮助 我 们 解决 
很 多 复杂 的 编程 挑战 。 


% java Zoom boy.jpg 1 .5 .5 
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数据 类 型 的 基本 元 素 为 了 描述 在 Java 类 中 实现 数据 类 型 的 过 程 ， 我 们 将 讨论 带电 粒 
子 的 数据 类 型 Charge。 特 别 是 ,我 们 感 兴 趣 的 是 采用 库 仓 定 律 “: 根 据 c-1q1 的 公式 求 点 Ce 用 的 电势 
的 二 维 模型 ， 即 一 个 带电 粒子 在 给 定位 置 点 的 电势 可 表示 为 本 革 
V=kg/r， 其 中 gq 是 电荷 量 , + 是 从 位 置 点 到 电荷 的 距离 ， 中 区 ” 


三 8.99X10”N. mYyC*， 是 静电 常数 。 当 存在 多 个 带电 粒子 时 ， r 
任何 一 点 的 电势 等 于 各 个 带电 粒子 产生 的 电势 之 和 。 为 了 保持 。， 2 
一 致 性 ， 我 们 使 用 ST 国际 单位 制 ): 在 公式 中 , N 表示 牛顿 (为 )， : 


m 表示 米 (距离 ),，C 表示 库仑 (电荷 )。 带电 粒子 c 的 电荷 量 为 g 
API。 应 用 程序 编程 接口 是 与 所 有 客户 程序 之 间 的 协议 ; 因 ， 必 
此 是 所 有 实现 的 起 点 。 以 下 是 带电 粒子 类 型 的 API， 平面 中 带电 粒子 的 库仑 定律 
public class Charge 
Charge(double x0, double y0, double q0) 
double potentialAt(double x，double y) (x y) 处 的 电势 
String toString() 字符 串 表 示 


带电 粒子 的 API (参见 程序 3.2.1 ) 


为 了 实现 Charge 数据 类 型 ， 我 们 需要 定义 数据 类 型 的 值 ， 并 实现 创建 带电 粒子 的 构造 
函数 ， 方 法 potentialAt() 用 于 返回 电荷 在 给 定位 置 点 (x，y) 处 的 电势 ，toString() 方法 返回 
电荷 的 字符 串 表示 形式 。 

类 。 在 Java 中 ,我 们 把 一 个 数据 类 型 实现 为 一 个 类 (class)。 同 使 用 的 静态 方法 库 一 
样 ， 可 以 把 一 个 数据 类 型 的 代码 存储 在 一 个 单独 的 文件 中 ， 后 跟 .java 扩展 名 。 我 们 已 经 实 
现 过 Java 类 ， 但 是 我 们 实现 的 类 并 没有 数据 类 型 的 关键 特性 : 构造 函数 、 若 干 实例 变量 和 
若干 实例 方法 。 构 建 的 这 些 模块 都 通过 访问 (或 可 见 ) 修饰 符 进行 限定 。 接 下 来 我 们 讨论 这 
四 个 概念 ， 并 举例 说 明 ， 最 终 实现 Charge 数据 类 型 (程序 3.2.1 )。 

访问 修饰 符 。 在 类 名 称 、 实 例 变量 名 称 和 方法 名 称 之 前 的 关键 字 public、private 和 final 
被 称 为 访问 修饰 符 。public 和 private 修饰 符 限制 客户 代码 的 访问 : 我 们 将 类 中 的 每 个 实例 
变量 和 方法 指定 为 public( 客 户 可 访问 ) 或 者 private( 客户 不 可 访问 )。 最 后 一 个 修饰 符 (final) 
表示 变量 的 值 一 旦 被 初始 化 就 不 能 更 改 一 一 它 是 只 读 的 。 我 们 对 修饰 符 的 使 用 规则 是 ，API 
中 的 构造 函数 和 方法 使 用 public 修饰 符 (因为 规则 承诺 将 它们 提供 给 客户 )， 而 其 他 的 都 使 
用 private 修饰 符 。 通 常 ， 私 有 方法 是 用 于 简化 类 中 其 他 方法 的 代码 的 辅助 方法 。Java 对 修 
饰 符 的 使 用 没有 太 严 格 的 限制 ，3.3 节 中 我 们 再 讨论 这 些 规 则 制定 的 原因 。 

实例 变量 。 编 写 代 码 实现 操作 数据 类 型 的 实例 方法 ， 首 先 需 要 声明 实例 变量 ， 实 例 变量 
用 于 在 代码 中 存储 相关 变量 的 值 。 一 个 变量 属于 一 个 类 型 的 特定 实例 。 使 用 与 声明 局 部 变量 
相同 的 方式 声明 实例 变量 ， 包 括 类 型 和 名 称 : Charge 包含 3 个 double 型 实例 变量 两 个 
用 来 描述 带电 粒子 在 平面 中 的 位 置 ， 一 个 用 来 描述 带电 粒子 的 电量 。 这 些 声明 由 类 中 的 第 一 
个 语句 创建 ， 而 不 是 在 main0 或 任何 其 他 方法 中 。 与 在 方法 或 模块 内 定义 的 局 部 变量 相 比 ， 
实例 变量 的 定义 存在 一 个 重要 的 区 别 : 在 给 定时 间 内 ， 每 个 局 部 变量 只 能 对 应 于 一 个 值 ， 但 
是 存在 与 实例 变量 对 应 的 许多 值 (每 个 对 象 都 是 数据 类 型 的 一 个 实例 ， 每 个 实例 中 都 有 一 个 
实例 变量 的 副本 )。 这 种 设计 不 会 产生 歧义 ， 因 为 每 次 调用 一 个 实例 方法 时 ， 都 是 使 用 对 象 
引用 来 实现 的 被 引用 的 对 象 的 实例 变量 就 是 正在 操作 的 值 。 

构造 函数 。 构 造 栅 数 用 于 创建 一 个 对 象 并 返回 该 对 象 的 引用 。Java 客户 程序 使 用 关键 字 
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new 自动 调用 构造 函数 。Java 可 以 自动 完成 大 部 分 工作 : 用 户 只 需要 编写 代码 将 实例 变量 初 
始 化 为 有 意义 的 值 。 构 造 函 数 名 总 是 与 类 名 相同 ， 
但 是 可 以 重 载 构造 函数 ， 并 拥有 多 个 构造 函数 ， 每 
个 构造 函数 拥有 不 同 的 参数 ， 就 像 静 态 方法 一 样 。 


public class Charge 


实例 变量 
的 声明 





对 于 客户 程序 而 言 ， 关 键 字 new 与 构造 函数 (括号 5 
内 带 有 参数 ) 形成 的 组 合 ， 就 像 二 个 返回 指定 类 型 } 
对 象 引 用 的 函数 调用 一 样 。 构 造 函 数 没有 返回 类 型 ， 站 全 家 生 


因为 构造 函数 总 是 返回 对 其 数据 类 型 对 象 的 引用 (数据 类 型 、 类 和 构造 函数 都 是 相同 的 名 
称 )。 每 次 客户 程序 调用 构造 函数 时 ，Java 会 自动 实现 以 下 功能 : 

。 为 对 象 分 配 内 存 。 

。 调用 构造 隐 数 代码 来 初始 化 实例 变量 。 

。 返回 对 新 创建 对 象 的 引用 。 

Charge 的 构造 函数 是 Java 中 构造 函数 的 经 典 样式 : 使 用 客户 程序 提供 的 值 初始 化 实例 变量 。 


访问 ”无 返回 构造 函数 名 称 
修饰 符 “” 值 类 型 (与 类 名 相同 ) J 


[double q0|) 







, [double y0| ， 





; | 一 一 构造 函数 体 函数 签名 


构造 函数 的 结构 


实 鲍 方 法 。 在 实现 实例 方法 时 ， 我 们 编写 的 代码 与 第 2 章 中 实现 静态 方法 (函数 ) 的 代 
码 十 分 相似 。 每 个 方法 都 有 一 个 签名 (签名 指定 了 方法 的 返回 类 型 以 及 参数 变量 的 类 型 和 名 
称 ) 和 一 个 主体 (由 一 系列 语句 组 成 ,包括 一 个 返回 语句 ， 返 回 值 返回 给 客户 程序 )。 当 客 
户 程序 调用 一 个 实例 方法 时 ， 系 统 用 客户 程序 提供 的 值 初始 化 参数 变量 ， 接 着 执行 程序 中 的 
语句 直到 return， 这 时 将 计算 结果 返回 给 客户 程序 ， 就 像 客 户 程序 中 的 方法 调用 语句 被 蔡 换 
成 了 返回 函数 的 结果 一 样 。 以 上 这 些 都 与 静态 方法 相同 ,但 实例 方法 有 一 个 关键 的 不 同 之 
处 : 它们 可 以 对 实例 变量 进行 操作 。 

访问 ”返回 








修 作答 值 类 型 方法 名 称 参数 变量 
| A Fr 
ET double x), [double ») 
= -8.99e09; - 参数 变量 名 函数 签名 
局 部 变量 a 
Ee -一 实例 变量 名 


[double dy|=y - 思 


return ky*q / 和 + dy*[dy) ; 


= 
调用 静态 方法 局 部 变量 名 
实例 方法 的 结构 


方法 内 的 变量 。 对 应 的 ， 我 们 编写 的 Java 代码 使 用 以 下 三 种 变量 实现 实例 方法 : 
。 参数 变量 
。 局 部 变量 


。 实例 变量 
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前 两 种 变量 与 静态 方法 相同 : 参数 变量 在 方法 的 声明 中 指定 ， 调 用 方法 时 用 客户 端 提供 的 
数据 初始 化 变量 ， 局 部 变量 在 函数 体 中 声明 和 初始 化 。 参 数 变量 的 作用 范围 是 整个 方法 ， 局 部 
变量 的 作用 范围 在 它们 被 定义 的 模块 语句 中 。 实 例 变量 则 完全 不 同 : 它们 为 类 中 的 对 象 保存 数 
据 类 型 的 值 ， 其 作用 域 是 整个 类 。 如 何 确定 我 们 想 要 使 用 哪个 对 象 的 值 ?” 只 要 我 们 想 一 想 这 个 
问题 ， 很 容易 得 到 答案 。 类 的 每 个 对 象 都 有 一 个 值 : 类 方法 中 的 代码 引用 了 用 于 调用 方法 的 对 
象 的 值 。 例 如 ， 当 我 们 写 c1.potentialAt(x，y) 时 ，potentialAt() 中 的 代码 引用 cl 的 实例 变量 。 

Charge 中 potentialAt() 的 实现 使 用 了 以 上 所 有 三 种 变量 ， 如 “实例 方法 的 结构 ”图 所 
示 ， 在 下 表 中 进行 汇总 。 , 

你 一 定 要 清楚 地 理解 实现 实例 方法 中 三 种 类 型 变量 之 间 的 区 别 。 理 解 这 些 差异 是 面向 对 


象 程序 设计 的 关键 。 


变量 名 称 变量 用 途 应 用 示例 “作用 范围 
实例 变量 数据 类 型 的 值 rxy ry, 类 中 

参数 变量 将 参数 从 客户 程序 传递 到 方法 x, y 方法 中 
局 部 变量 方法 中 临时 使 用 dx, dy 模块 中 
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程序 3.2.1 “带电 粒子 


public class Charge 


} 


private final double rx, ry; 


rx, ry -| 查询 点 


private final double q; 9 电量 
public Charge(double x0, double y0, double q0) 


{ 


rx = x0; ry = y0; q = q0; 3 


public double potentialAt(double x, double y) 
{ 


} 
public String toString(O) 
{ 


double k = 8.99e09; 

double dx = x - rx; 

double dy =y-ry 

return ky*q/ 站 sqrt(dx*dx + dy*dy); 


return q+ "at™ 4 "(+ rx Henry 


piblic static void main(String[] args) 
{ 


} 


double x = Double.parseDouble(args[0]); 

double y = Double.parseDouble(args[1]); 

Charge cl = new Charge(0.51, 0.63, 21.3); 

Charge c2 = new Charge(0.13, 0.94, 81.9); 产生 的 妆 能 
StdOut.print1in(c1); 2 | 
StdOut.print1n(Cc2); c2 产 生 的 势能 
double v1 = cl1.potentialAt(x, y); 

double v2 = c2.potentialAt(x, y); 

StdOut.printf("%.2e\n", (v1 + v2)); 


带电 粒子 数据 类 型 的 实现 包含 每 个 数据 类 型 的 基本 组 成 部 分 : 实例 变量 


rx、ry 和 和 gq， 


构造 函数 Charge0， 实 例 方 法 potentialAt0 和 toString0， 以 及 一 个 


测试 客户 程序 main0O。 


% java Charge 0.2 0.5 % java Charge 0.51 0.94 
21.3 at (0.51, 0.63) 21.3 at (0.51, 0.63) 
81.9 at (0.13, 0.94) 81.9 at (0.13, 0.94) 
2.22e+12 2.56e+12 
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测试 客户 程序 。 每 个 类 都 可 以 定义 自己 的 测试 程序 main(0)， 通 常 main() 方法 会 保留 以 
测试 数据 类 型 。 测 试 客户 程序 至 少 应 该 调用 类 中 的 每 个 构 
造 函数 和 实例 方法 。 例 如 ， 程 序 3.2.1 中 的 main() 方法 需 gh 
要 两 个 命令 行 参数 x 和 y， 创 建 两 个 Charge 对 象 ， 并 且 输 
出 这 两 个 带电 粒子 在 位 置 (x，y) 处 产生 的 总 电势 。 当 存 (0.13,0.94) 罚 。 “具有 电荷 值 21.3 
在 多 个 带电 粒子 时 ， 任 何 一 点 的 电势 等 于 各 个 带电 粒子 产 这 主人 全 的 人 
生 的 电势 之 和 。 be | 0.63) 

这 些 是 我 们 需要 了 解 的 基本 内 容 ， 以 便 能 够 在 Java Ef 
中 自 定义 数据 类 型 。 在 我 们 将 开发 的 每 种 数据 类 型 (Java 
类 ) 中 ， 都 要 具有 相同 的 基本 元 素 : 实例 变量 、 构 造 函 数 、 该 位 置 点 的 电势 为 
实例 方法 和 测试 客户 程序 。 每 种 数据 类 型 的 开发 均 遵 循 相 22 0 人 
同 的 步骤。 为 了 完成 一 个 计算 目标 ， 我 们 不 应 该 纠结 于 
下 一 步 需要 采取 什么 具体 行动 (开始 学 习 编 程 时 经 常 这 样 做 )， 而 应 该 考虑 客户 程序 的 需求 ， 
然后 在 数据 类 型 中 实现 这 些 需求 。 

创建 数据 类 型 的 第 一 步 是 设计 其 API。API 的 目的 是 将 客户 端 与 具体 的 实现 分 开 ， 以 便 
实现 模块 化 编程 。 设 计 API 时 有 两 个 目标 。 首 先 ， 我 们 希望 客户 端 代码 清晰 和 正确 。 事 实 
上 ， 在 最 终 确定 API 之前， 先 编写 一 些 客户 代码 是 一 个 好 主意 ， 以 确保 设计 的 数据 类 型 操 
作 符合 客户 程序 的 需求 。 其 次 ， 我 们 必须 能 够 实现 这 些 运算 操作 。 很 显然 ， 无 法 实现 的 运算 
操作 是 毫 无 意义 的 。 

创建 一 个 数据 类 型 的 第 二 步 是 实现 满足 其 API 的 Java 类 。 首 先 编写 构造 函数 以 定义 和 
初始 化 实例 变量 ， 然 后 编写 处 理 实例 变量 的 方法 以 实现 所 需要 的 功能 。 

创建 数据 类 型 的 第 三 步 是 编写 一 个 测试 客户 程序 ， 以 验证 前 两 个 步 又 中 做 出 的 设计 是 否 
正确 。 

定义 数据 类 型 的 值 是 什么 ”针对 这 些 值 ， 客 户 程序 会 执行 哪些 操作 ? 确定 了 这 些 基本 问 
题 后 ， 我 们 就 可 以 创建 新 的 数据 类 型 ， 然 后 像 使 用 内 置 数据 类 型 一 样 ， 使 用 自 定义 数据 类 型 

BE5 引 来 编写 客户 应 用 程序 。 本 节 末尾 将 提供 许多 练习 ， 旨 在 为 读者 提供 创建 数据 类 型 的 经 验 。 


a 
(0.2, 0.5) w *. 0.34 


public class Charge 


实例 变量 pri vate a tot es i 类 名 
private LN rep 


构造 函数 public Charge (double x0，double y0, double q0) 
{ rx= x0; ry = y0; q= q0; } 








public double potentialAt(double x, double y) 
{ 
double k = Se 
实例 变量 4 
double dx = x - rx; 实例 变量 名 
double dy = y - ry; 
| return k * q / Math.sqrt(dx*dx + dy*dy), 








实例 方法 
实例 方 ; 


起 public String toString() 
bn et 


类 的 结构 
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测试 客户 程序 一 一 -| public static void main(String[] args) 
罗 入 


double x = Double.parseDouble(args[0]); 
double y = Double.parseDouble(args[1]); 


创建 和 初始 化 对 象 RE Charge cl =|new Charge(0.51, 0.63, 21.3); 


一 一 Charge c2 = new Charge(0.13, 0.94, 81.9);\ 
double v1 = cl.potentialAt (x, y); 、 i 
double v2 =| c2.potentialAt (x, y); 调用 构造 函数 
Tt (vl + 4 

} 

} 对 象 名 调用 方法 

类 的 结构 ( 续 ) 


秒表 面向 对 象 程序 设计 的 特点 之 一 是 ， 通 过 创建 抽象 编程 对 象 ， 就 可 以 轻松 地 对 真实 
世界 的 对 象 建 模 。 作 为 一 个 简单 的 程序 示例 ，Stopwatch (程序 3.3.2 ) 实现 了 以 下 API: 














public class Stopwatch 





Stopwatch() 创建 一 个 新 的 秒表 对 象 并 运行 
double elapsedTime() 自 秒表 创建 以 来 所 经 过 的 时 间 ( 以 秒 为 单位 ) 


Stopwatch API ( 见 程 序 3.2.2 ) 


简单 来 说 ，Stopwatch 对 象 是 老式 秒表 的 精简 版 本 。 创 建 一 个 Stopwatch 对 象 后 ， 秒 表 
开始 运行 ,我们 可 以 通过 调用 elapsedTime() 方法 来 查询 秒表 已 经 运行 的 时 间 。 用 户 也 可 以 
加 入 各 种 各 样 、 花 里 胡 哨 的 功能 到 Stopwatch 一 一 任何 你 能 够 想象 到 的 东西 。 你 是 否 希望 重 
置 秒表 ?开始 或 停止 秒表 ?再 加 入 一 个 单 圈 计时 器 ?添加 这 些 功能 很 容易 的 (具体 参见 练习 
$3919) 

Stopwatch 的 实现 使 用 了 Java 的 系统 方法 System.currentTimeMillis()， 
其 返回 一 个 long 型 值 ， 以 毫秒 为 单位 ( 自 1970 年 1 月 1 日 凌晨 0 点 整 以 
来 的 毫秒 数 )。Stopwatch 数据 类 型 的 实现 非常 简单 。 一 个 Stopwatch 对 
象 保 存 其 创建 时 间 到 一 个 实例 变量 中 ， 每 当 客 户 端 调用 其 elapsedTime() 
方法 时 ， 都 会 返回 该 时 间 与 当前 时 间 的 时 间 差 值 。Stopwatch 对 象 本 身 并 
不 计时 (计算 机 内 部 系统 时 钟 为 所 有 的 Stopwatch 对 象 计 时 )，Stopwatch 
对 象 只 是 造成 了 它 为 客户 程序 计时 的 幻觉 。 为 什么 客户 程序 不 直接 使 用 
System.currentTimeMillis() ?我们 当然 可 以 这 样 做 , 但 使 用 Stopwatch 使 
得 客户 程序 更 容易 理解 和 维护 。 

测试 客户 程序 是 一 个 典型 实现 。 它 首先 创建 两 个 Stopwatch 对 象 ， 然 后 使 用 它们 来 测 
量 两 种 不 同 计算 的 运行 时 间 ， 最 后 输出 运行 时 间 。 自 最 初 运行 的 若干 程序 开始 ， 就 一 直 
存在 一 个 难题 : 在 程序 开发 中 ， 一 种 方法 是 否 优 于 另 一 种 方法 ? 这 个 问题 至 关 重 要 。 在 
4.1 节 中 ， 我 们 将 开发 一 个 科学 的 方法 来 理解 计算 的 开销 。Stopwatch 在 该 方法 中 是 有 用 的 
工具 。 

直方 图 现在 ,我 们 讨论 一 个 数据 类 型 ， 这 个 类 型 可 以 使 用 我 们 熟悉 的 直方 图 显示 数 
据 。 为 简单 起 见 ， 假 定数 据 是 0 到 之 间 的 整数 值 序列 。 直 方 图 计算 每 个 值 的 出 现 次 数 ， 并 
给 每 个 值 绘制 条 形 图 (高度 与 其 出 现 频率 成 正比 )。 以 下 API 描述 了 这 些 操作 : 
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程序 3.2.2 ”秒表 
















public class Stopwatch 
{ 





start | 创建 时 间 


private final long start; 





public StopwatchO 
{ start = System.currentTimeMil1l1is(); } 








public double elapsedTime() 
£ 


long now = System.currentTimeMi]11is(); 
return (now - start) / 1000.0; 







public static void main(String[] args) 


// 使 用 Math.sqrt() 计 算 时 间 
int n = Integer.parseInt(args[0]); 
Stopwatch timerl1 = new Stopwatch(); 
double suml = 0.0; 
for (Cint 1 = 1; 1 <= ni i++) 
suml += Math.sqrt(i) ; 
double timel = timerl.elapsedTime(); 
StdOut.printf("%e (%.2f seconds)\n", suml, timel1); 


/1/ 使 用 Math:pow() 计 算 时 间 
Stopwatch timer2 = new Stopwatch() ; 
double sum2 = 0.0; 
for (int i = 1; i <= n; i++) 
sum2 += Math.powC(i, 0.5); 
double time2 = timer2.elapsedTime CO); 
StdOut.printf("%e (%.2f seconds)\n", sum2, time2); 





























这 个 类 实现 了 一 个 简单 的 数据 类 型 ， 可 以 用 于 比较 性 能 关键 (performance 
critical ) 方法 的 运行 时 间 ( 具体 参见 4.1 节 ) 。 测 试 客户 程序 比较 Java 数 学 库 中 
两 个 函数 计算 平方 根 的 运行 时 间 。 对 于 计算 从 1 到 "的 数字 的 平方 根 之 和 的 任务 ， 
调用 Math.sqrt0 比 调用 Math.pow0 快 10 倍 以 上 。 结 果 可 能 因 系 统 而 异 。 












% java Stopwatch 100000000 
6.666667e+11 (0.65 seconds) 
”6.666667e+1l1 (8.47 seconds) 







public class Histogram 


Histogram(Cint nm) 创建 0 到 n-1 整 数值 的 直方 图 
double ‘aaddDataPoint(int i) ”添加 整数 的 出 现 次 数 
void draw() 在 标准 绘图 上 绘制 直方 图 


直方 图 的 API ( 见 程序 3.2.3 ) 


要 实现 这 样 一 个 数据 类 型 ， 我 们 必须 首先 确定 使 用 什么 样 的 实例 变量 。 在 这 种 情况 
下 ， 需 要 使 用 一 个 数组 作为 实例 变量 。 具 体 来 说 ，Histogram (程序 3.2.3 ) 维护 一 个 实例 
变量 freq[]， 对 于 0 到 n-1 之 间 的 每 个 i， 便 于 freqli] 记录 数据 值 在 数据 中 出 现 的 次 数 。 
Histogram 类 型 还 包含 一 个 整数 实例 变量 max， 用 于 存储 所 有 值 中 的 最 大 频率 (对 应 于 最 高 
条 柱 的 高 度 )。 实 例 方法 draw0 使 用 变量 max 来 设置 标准 绘图 窗口 的 纵 轴 尺度 ， 并 调用 方法 
StdStats.plotBars() 绘制 数据 值 的 直方 图 。main() 方法 是 执行 伯 努 利 试验 的 示例 客户 程序 。 它 
比 Bernoulli (程序 2.2.6 ) 简单 得 多 ， 因 为 其 使 用 Histogram 数据 类 型 。 
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通过 创建 像 Histogram 这 样 的 数据 类 型 ， 我 们 可 以 体会 到 第 2 章 讨论 的 模块 化 编程 (可 
复 用 代码 、 独 立 开发 小 程序 等 ) 的 好 处 ， 以 及 数据 分 离 的 优点 。 如 果 没 有 Histogram 类 型 ， 
我 们 必须 将 用 于 创建 直方 图 的 代码 与 用 于 计算 数据 的 代码 混合 起 来 ， 结 果 会 导致 程序 比 两 个 
单独 的 程序 更 加 难以 理解 和 维护 。 在 计算 中 应 当 清 晰 地 分 离 数据 和 相关 的 计算 任务 。 


程序 3.2.3 直方 图 





public class Histogram 


private final double[] freq; freq[] | 频率 计数 
private double max; max 最 高 频率 


public Histogram(int n) 
{ // 创建 二 个 新 的 直方 图 
freq = new double[n]; 


} 


public void addDataPoint(int i) 
{”V// 整数 的 出 现 次 数 增加 1 
freq[i]++; 
if (freq[i] > max) max = freq[i]; 


public void draw() % java Histogram 50 1000000 
{ /WU 绘制 (和 缩放 ) 直方 图 

StdDraw.setYscale(0, max); 

StdStats .plotBars(freq); 


public static void main(String[] args) 

所 大 见 程序 252.6 
int n = Integer.parseInt(args[0]); 
int trials = Integer.parseInt(args[1]); 
Histogram histogram = new Histogram(n+1); 
StdDraw.setCanvasSize(500, 200); 
for (int t = 0; t < trials; t++) 

histogram.addDataPoint(Bernoulli.binomial(n)); 
histogram.drawO; 
} 


此 数据 类 型 支持 使 用 简单 的 客户 代码 ， 以 创建 0 到 n=1 之 间 整 数值 出 现 频 
率 的 直方 图 ; 频率 保存 在 一 个 实例 变量 数组 中 。 整 数 实例 变量 max 存 储 数值 
出 现 的 最 大 频率 ( 绘制 直方 图 时 用 于 缩放 y 轴 ) 。 示 例 客户 程序 是 Bernoulli 
ed 的 一 个 修改 版 本 ,但 由 于 使 用 了 Histogram 数 据 类 型 ， 因 此 实现 
起 来 很 简单 。 





海龟 绘图 在 计算 中 应 当 将 一 个 大 任务 清晰 地 划分 成 若干 个 独立 的 小 任务 。 在 面向 对 象 
程序 设计 中 ， 我 们 拓展 该 设计 理念 ， 被 划分 的 还 应 该 包括 任务 的 数据 (或 状态 )。 减 少 状态 
的 数量 对 于 简化 计算 过 程 非常 有 价值 。 接 下 来 ， 我 们 讨论 海龟 绘图 ， 其 基于 数据 类 型 的 API 
定义 如 下 : 


public class Turtle 


Turtle(double x0, double y0, double a0) jo i 


void turnLeft(double delta) 逆 时 针 旋 转 delta 度 
void goForward(double step) 移动 step 距 离 ， 绘 制 一 条 直线 
海龟 绘图 API ( 见 程序 3.2.4 ) 
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2 潮 向 他 


想象 二 下 ， 一 个 生活 在 单位 正方 形 内 的 海龟 ， 它 在 移动 时 会 画 出 直线 。 海 龟 可 以 沿 直线 
移动 指定 的 距离 ， 也 可 以 向 左 〔 逆 时 针 ) 旋转 指定 ，，，，、 
的 角度 。 根 据 API， 当 我 们 创建 一 个 海龟 时 ， 我们 98001870 2 0'6; 
把 它 放 在 一 个 指定 的 位 置 点 十， 面 对 一 个 指定 的 方 。 double ae 00 sort 有 2; 
向 。 然 后 ， 通 过 给 海龟 提供 一 系列 的 goForward() Turte turtle Tenen JuteQ0, y0, a0); 
和 turnLeft() 命令 来 创建 绘图 。 

例如 ， 为 了 绘制 一 个 等 边 三 角形 ， 我 们 在 
(0.5,0 ) 处 创建 一 个 海龟 ， 面 向 与 原点 逆 时 针 成 
60° 角 ， 指 示 它 向 前 移动 一 步 ， 逆 时 针 旋 转 120。， 
再 向 前 移动 一 步 ， 然 后 逆 时 针 旋 转 120*， 再 向 前 迈 
出 第 三 步 ， 完 成 三 角形 的 绘制 。 事 实 上 ， 我 们 要 研 
究 的 所 有 的 turtle 客户 都 是 简单 创建 一 只 海龟 ， 然 
后 交错 发 出 一 系列 移动 和 旋转 的 指令 ， 只 是 移动 的 
步 长 和 旋转 的 角度 各 不 相同 而 已 。 你 稍 后 会 发 现 ， 
这 个 简单 的 模型 允许 我 们 创建 任意 复杂 的 图 像 ， 应 
用 十 分 广泛 。 

Turtle (程序 3.2.4) 是 其 API 的 一 种 实现 ， 程 序 使 用 了 模块 StdDraw。Turtle 类 维护 三 
个 实例 变量 : 海龟 位 置 的 坐标 和 当前 的 方向 (从 x 轴 逆 时 针 方向 测量 ) 。Turtle 类 实现 了 用 于 
更 新 这 些 实例 变量 的 两 个 方法 ， 所 以 Turtle 类 是 可 变 对 象 。 这 些 更 新 方法 的 实现 很 简单 : 
turnLeft(delta) 将 当前 角度 增加 delta，goForward(step) 将 当前 x 坐标 递增 step 乘 以 当前 角 
度 的 余弦 值 ， 把 当前 y 坐 标 递增 step 乘 以 当前 角度 的 正 
弦 值 。 

Turtle 的 测试 客户 程序 接收 一 个 整数 作为 命令 行 参 数 n， 
并 绘制 一 个 n 边 正 多 边 形 。 如 果 你 对 初等 解析 几何 感 兴趣 ， 
可 以 验证 结果 的 正确 性 。 无 论 是 否 进行 验证 ， 请 你 思考 一 个 
问题 : 如 何 计算 多 边 形 中 所 有 点 的 坐标 。 海 龟 绘 图 方法 的 简 
洁 性 是 非常 有 吸引 力 的 。 简 单 来 说 ,海龟 绘图 可 以 作为 描述 US 
各 种 几何 形状 的 抽象 。 例 如 ， 通 过 把 n 设 置 足够 大 ， 可 以 获 Ss (三 角 学 ) 
得 一 个 近似 的 圆 。 

我 们 像 使 用 任何 其 他 对 象 一 样 使 用 Turtle。 程 序 可 以 创建 Turtle 对 象 的 数组 ， 也 可 以 将 
其 作为 参数 传递 给 函数 等 。 这 些 例子 体现 了 这 些 功 能 ， 证 明 创建 像 Turtle 这 样 的 数据 类 型 是 
非常 简单 且 实 用 的 。 针 对 各 种 规则 的 多 边 形 ， 程 序 可 以 计算 所 有 点 的 坐标 并 连接 直线 来 获得 
图 形 ， 但 是 使 用 Turtle 类 会 更 容易 实现 。 海 龟 绘 图 的 例子 体现 了 数据 抽象 的 价值 。 





海龟 绘图 的 第 一 步 


上 再 人) +Qdsino0) 


d sin Q 





turtle,.goForward(step); turtle. turnLeft (120.0); turtle.goForward(step); turtle.turnLeft(120.0); turtle.goForward(step); 


才 


你 的 第 一 个 海龟 绘图 
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程序 3.2.4” 海 旬 绘 图 
A class Turtle x，y 坐标 位 置 (在 单位 正方 形 内 ) 
private double x, y; angTe | 运动 方向 (角度 ， 与 x 轴 北 
时 针 方 向 夹 角 ) 


private double angle; 

public Turtle(double x0, double y0, double a0) 

{ x= XxX0; y = y0; angle = a0; 上 

public void turnLeft(double delta) 

{ angle += delta; } 

public void goForward(double step) 

{ // 计算 新 位 置 ， 移 动 并 画 线 
double oldx = x, oldy = y; 
x += Step * Math.cos(Math.toRadians(angle)); 
y += Step * Math.sin(Math.toRadians(angle)); 
StdDraw.line(oldx, oldy, x, y); 

} 

public static void main(String[] args) 

{ // 绘制 一 个 正 n 边 形 
int n = Integer.parseInt(args[0]); 
double angle = 360.0 / ni; 
double step = Math.sin(Math.toRadians(angle/2)); 
Turtle turtle = new Turtle(0.5, 0.0, angle/2); 
for (int 1 = 0; T° < n; i++) 


turtle.goForward(step); 
turtle.turnLeft(angle); 
} 
} 
} 


实现 的 数据 类 型 支持 海龟 绘图 .经 常用 于 简单 图 形 的 创建 。 


% java Turtle 3 | % java Turtle 7 % java Turtle 1000 


Te 


递归 图 形 。0 阶 的 科 赫 曲线 (Koch curve) 是 一 条 直线 段 。 通 过 以 下 方法 ， 可 以 形成 一 
条 n 阶 的 科 赫 曲线 : 绘制 一 条 n-1 阶 的 科 赫 曲线 ， 向 左旋 转 60。， 再 绘制 一 条 n-1 阶 的 科 赫 
曲线 ， 向 右 转 120。 (向 左 转 -120。)， 绘 制 第 三 条 n-1 阶 的 科 赫 曲线 ， 向 左 转 60° ， 绘 制 第 
四 条 n-1 阶 的 科 赫 曲线 。 显 然 ， 这 些 递归 指令 可 以 通过 海龟 绘图 客户 代码 实现 。 经 过 适当 的 
修改 ， 类 似 的 递归 方案 可 以 用 来 模拟 自然 界 中 发 现 的 自 相似 模式 ， 比 如 雪花 。 

客户 端 代 码 思路 非常 直截了当 ， 除 了 步 长 的 值 有 些 麻烦 。 如 果 仔细 阅读 前 几 个 示例 ， 读 
者 将 发 现 (并 能 够 通过 归纳 法 证 明 ),，n 阶 曲 线 的 宽度 是 步 长 的 3" 倍 ， 所 以 设置 步 长 为 113"， 
会 产生 一 条 宽度 为 1 的 曲线 。 类 似 地 ，n 阶 曲线 中 的 步 数 是 4“， 所 以 如 果 n 比较 大 ，Koch 
程序 将 无 法 正常 结束 。 

我 们 可 以 找到 很 多 这 样 的 递归 模式 的 示例 ， 这 些 模式 已 经 被 不 同文 化 背景 的 数学 家 、 科 
学 家 和 艺术 家 研究 和 开发 过 了 。 在 这 里 我 们 关注 的 是 ， 海 龟 绘 图 抽象 可 以 大 大 简化 绘制 递归 
图 形 的 客户 代码 。 
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public class Koch 
public static void koch(int n, double step, Turtle turtle) 
{ 
让 Cn == 0) 
{ 


turtle.goForward(step); 
return; 


koch(n-1, step, turtle); 
turtle.turnLeft(60.0); 
koch(n-1, step, turtle); 
turtle.turnLeft(-120.0); 
koch(n-1, step, turtle); 
turtle.turnLeft(60.0); 
koch(n-1, step, turtle); 
} 


public static void main(String[] args) 


ll 


int n = Integer.parseInt(args[0]); 
double step = 1.0 / Math.pow(3.0, n); 
Turtle turtle = new Turtle(0.0, 0.0, 0.0); 
koch(n, step, turtle); 
} 
} 


用 海龟 绘图 绘制 科 赫 曲 线 


等 角 螺 线 。 经 过 4" 个 步骤 绘制 科 赫 曲线 后 ; 也许 海 包 已 经 有 些 疲倦 了 。 因 此 ， 假设 每 
次 迈步 时 ,海龟 的 步 长 都 会 以 微小 的 常数 递减 。 绘 制 的 图 形 会 发 生 什么 变化 ?特别 地 ， 修 改 
程序 3.2.4 中 的 多 边 形 绘制 的 客户 程序 来 回答 这 个 问题 ， 程 序 会 产生 一 个 被 称 为 对 数 螺旋 的 
图 形 ， 这 个 曲线 在 自然 界 的 许多 环境 中 都 可 以 找到 。 

Spiral (程序 3.2.5 ) 是 这 条 曲线 的 一 个 实现 。 程 序 的 命令 行 参 数 为 n 和 衰变 因子 ， 指 示 
海龟 交替 地 前 行 和 转动 ， 直 到 它 缠绕 10 次 。 从 程序 中 给 出 的 四 个 例子 中 可 以 看 出 ， 如 果 豪 
减 因 子 大 于 1， 则 螺旋 的 路 径 会 到 达 图 形 的 中 心 。 参 数 n 控制 螺旋 的 形状 。 建 议 读者 尝试 使 
用 不 同 的 参数 测试 Spiral， 以 理解 各 参数 如 何 控制 螺旋 曲线 的 行为 s 

对 数 螺旋 最 早 是 由 笛 卡 儿 (René Descartes) 于 1638 年 提出 的 。 雅 各 布 . 伯 努 利 (Jacob Bernoulli) 
对 其 数学 性 质感 到 非常 惊讶 ， 将 其 命名 为 等 角 螺 线 ( spira mirabilis)， 甚 至 要 求 将 其 刻 在 自己 的 
莫 碑 上 。 许 多 人 也 认为 它 是 一 神奇 的 ”， 因 为 这 种 精确 曲线 清楚 地 存在 于 各 种 各 样 的 自然 现象 
中 。 下 面 是 三 个 例子 : 一 个 鹦鹉 螺 的 贝克 ， 一 个 螺旋 星系 的 旋 臂 ， 一 个 热带 风暴 的 形成 图 。 
科学 家 还 观察 到 ， 座 接近 猎物 时 的 路 径 和 带电 粒子 垂直 向 均匀 磁场 移动 的 曲线 都 是 螺旋 曲线 。 

科学 探究 的 目标 之 一 就 是 为 复杂 的 自然 现象 提供 一 个 简单 但 准确 的 模型 。 我 们 不 知 疲倦 
的 海龟 肯定 经 受 住 了 考验 ! 


奴 趋 螺 过 螺旋 星系 热带 暴风 去 





图 片 来 源 :-Chris73(CC byYSA Ticense) -图片 来 源 :; NASA and ESA 


自然 界 等 角 螺 线 示例 
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程序 3.2.5 ”等 角 螺 线 





public class Spiral 


step | 步 长 
public static void main(String[] args) decay | 递减 因子 
{ angle | 旋转 量 
int n = Integer.parseInt(args[0]); turtle | 疲倦 的 海 包 


double decay = Double.parseDouble(args[1]); 
double angle = 360.0 /nn; 

double step = Math.sin(Math.toRadians(angle/2)); 
Turtle turtle = new Turtle(0.5, 0, angle/2); 


for (int 1 = 0; i < 10 * 360 / angle; i++) 
{ 
step /= decay; 


turtle.goForward(step); 
turtle.turnLeft(angle); 


这 个 代码 是 程序 3.24 中 测试 客户 程序 的 修改 版 本 : 程序 每 一 步 递 碱 步 长 ， 
并 且 环 绕 了 大 约 10 次 。angle 控 制 形状 ; 递减 因子 decay 控 制 螺旋 的 本 质 。 





% java Spiral 3 1.0 % java Spiral 1440 1.00004 
% java Spiral 3 1.2 % java Spiral 1440 1.0004 


MN 


布衣 运动。 假设“ 海 包 ”有 很 多 只 。 因 此 ,请 读者 想象 一 只 迷失 方向 的 海龟 (同样 遵循 
其 标准 的 交替 转向 和 前 行规 则 ) 在 每 一 步 之 前 随机 转向 。 很 容易 绘制 该 海龟 经 过 数 百 万 步 后 
的 路 径 ， 而 这 样 的 路 径 在 自然 界 许多 情况 下 存在 。1827 年 ， 植 物 学 家 罗伯特 : 布朗 (Robert 
Brown) 通过 显微镜 观察 到 ， 从 花粉 中 喷 出 的 微小 颗粒 浸入 水 中 后 ,似乎 以 迷失 方向 的 海 
怨 的 运动 方式 随机 移动 。 这 个 过 程 后 来 被 称 为 布朗 运动 ， 并 且 启 发 了 阿尔 伯 特 ' 爱 因 斯 坦 
(Albert Einstein) 对 物质 原子 本 质 的 洞察 。 

也 许 海 怨 有 小 伙伴 ， 而 且 数量 很 多 。 在 它们 移动 了 很 长 一 段 时 间 后 ， 它 们 的 路 径 合并 在 一 
起 ， 成 为 一 个 不 可 分 割 的 路 径 。 现 在 ， 天 体 物 理学 家 使 用 这 个 模型 来 了 解 遥 远 星 系 的 观测 特性 。 

海 包 绘 图 最 初 由 麻 省 理工 学 院 的 西蒙 * 派 珀 特 (Seymour Papert) 在 20 世纪 60 年 代 开 
发 ， 作 为 教育 程序 设计 语言 Logo 的 一 部 分 ，Logo 语言 至 今 仍 在 “玩具 ”计算 机 中 使 用 。 然 
而 ， 正 如 若干 科学 实例 表明 的 ， 海 包 绘 图 不 是 “玩具 ”， 海 包 绘 图 也 有 许多 商业 应 用 。 例 如 ， 
它 是 PostScript 的 基础 ，PostScript 是 一 种 用 于 创建 大 多 数 报纸 、 杂 志和 书籍 的 打印 页 面 的 
编程 语言 。 在 本 节 内 容 中 ，Turtle 是 一 个 典型 的 面向 对 象 程序 设计 实例 ， 表 明了 少量 的 保存 
状态 〈 使 用 对 象 完 成 数据 抽象 ， 而 不 仅仅 是 函数 ) 可 以 大 大 简化 计算 过 程 。 
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public class DrunkenTurtle 
% java DrunkenTurtle 10000 0.01 





{ 
public static void main(String[] args) 
{ 
int trials = Integer.parseInt(args[0]); 
double step = Double.parseDouble(args[1]); 
Turtle turtle = new Turtle(0.5, 0.5, 0.0); 
for (int t = 0; t < trials; t++) 
{ 
turtle.turnLeft(StdRandom.uniform(0.0, 360.0)); 
turtle.goForward(step); 
} 
} 
} 


一 只 醉酒 的 海龟 的 布朗 运动 (随机 移动 一 个 固定 的 距离 ) 


public class DrunkenTurtles 
{ 
public static void main(String[] args) 
{ 
int n = Integer.parseInt(args[0]); 1/ 海鱼 的 数量 
int trials = Integer.parseInt(args[1]); 1/ 步 数 
double step = Double.parseDouble(args[2]); / 步 长 
Turtle[] turtles = new Turtle[n]; 
for (Cint 1 = 0; i < n; i++) 


double x = StdRandom.uniform(0.0, 1.0); 
double y = StdRandom.uniform(0.0, 1.0); 


turtles[i] = new Turtle(x, y, 0.0); 


Lm 


for (int t = 0; t < trials; t++) 
{ W/ 所 有 的 海龟 走 一 步 
fom Cint 1 = 0; i < Tn: i++) 
{ VW/ 海 龟 1f 向 一 个 随机 的 方向 走 一 步 
turtles[i] .turnLeft(StdRandom.uniform(0.0, 360.0)); 
turtles[i] .goForward(step); 











% java DrunkenTurtles 20 5000 0.005 
20 500 0.005 





20 1000 0.005 


redid | 
“ 


< 





一 群 醉 龟 的 布朗 运动 


面向 对 育 编 程 ”237 


复数 ”复数 是 xtiy 形式 的 数字 ， 其 中 x 和 yy 是 实数 ,i 是 -1 的 平方 根 。x 被 称 为 复数 的 
实 部 , y 被 称 为 复数 的 虚 部 。 这 个 术语 源 于 这 个 概念 ， 即 -1 的 平方 根 为 虚数 ， 因 为 没有 任 
何 实数 对 应 于 这 个 值 。 复 数 是 典型 的 数学 抽象 : 不 管 人 们 是 否 相 信 “-1” 的 平方 根 存在 实际 
意义 ,复数 有 助 于 我 们 理解 自然 界 。 复数 被 广泛 应 用 于 应 用 数学 ,在 许多 科学 和 工程 学 科 中 
发 挥 着 重要 的 作用 。 复 数 还 被 用 于 建 模 各 种 物理 系统 ， 从 电路 到 声波 到 电磁 场 。 这 些 模型 往 
往 需要 大 量 涉及 操作 复数 的 计算 ， 复 数 运算 基于 规范 的 数学 运算 ， 所 以 我 们 要 编写 计算 机 程 
序 来 实现 。 简 而 言 之 ， 我 们 需要 一 种 新 的 数据 类 型 。 

为 复数 定义 数据 类 型 是 面向 对 象 程序 设计 的 一 个 典型 例子 。 没 有 一 种 编程 语言 可 以 提供 
给 我 们 可 能 需要 的 所 有 数学 抽象 的 实现 ， 但 是 自 定义 数据 类 型 的 能 力 使 我 们 不 仅 能 够 编写 程 
序 来 轻松 操纵 抽象 概念 ， 如 复数 、 多 项 式 、 向 量 和 矩阵， 而 且 还 能 赋予 我 们 利用 抽象 思维 思 
考 问题 的 自由 。 

复数 运算 所 需要 的 基本 运算 包括 : 利用 交换 律 、 结 合 律 和 分 配 律 (以 及 等 式 了 Y=-1 ) 进 
行 的 加 法 、 乘 法 等 基础 代数 计算 ; 计算 复数 的 模 数 ; 返回 实 部 和 虚 部 等 。 这 些 计算 的 规则 
如 下 : 

。 加 法 : (x+tiy)+(vtiw)=(x+v)+i(y+w) 

。 乘法 : (x+iy)X(vtiw)=(xv-pyw)+iQvtxw) 

。 模 数 ; etiy|= x 

。 实 部 : Re(x+iy)=x 

。 虚 部 : Im(x+iy)=y 

例如 ， 如 果 a=3+4i，b=2+3i, 那么 a+b=1+7i, a Xb=18+i, Re(a)=3, Im(4)=4, |a|=5。 

基于 上 述 基本 定义 ， 实 现 复数 数据 类 型 的 方法 变 得 十 分 清楚 明了 。 像 往常 一 样 ， 我 们 从 
定义 数据 类 型 运算 操作 的 API 开始 : 


public class Complex 








Complex(double real, double imag) 


Complex plus(Complex b) 这 个 数字 和 b 的 和 
Complex times(Complex b) 这 个 数字 和 b 的 乘积 
double abs() 求 模 
double re() 实 部 
double im() 虚 部 
String toString() 字符 品类 示 


复数 的 API (参见 程序 3.2.6 ) 


为 了 简单 起 见 ， 在 本 书 正文 中 ， 我 们 只 关注 API 中 的 基本 运算 ,在 练习 3.2.19 则 要 求 
读者 考虑 API 中 的 其 他 一 些 有 用 的 操作 。 

Complex (程序 3.2.6 ) 是 实现 这 个 API 的 一 个 类 。 它 具有 与 Charge (以 及 每 个 Java 数 
据 类 型 实现 ) 相同 的 组 件 : 实例 变量 (re 和 im)、 构 造 函 数 、 实 例 方法 (plus()、times()、 
abs()、re()、im() 和 toString0) 和 一 个 测试 客户 程序 。 测 试 客户 程序 首先 将 设置 z 为 1+i， 
然后 设置 z 为 za， 然后 计算 如 下 表达 式 : 


2=2 十 zZo=(1+i)? 寺 (1+i)=(1+2i-1)+(1+i)=1+3i 
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2=2°+z0=(1+3i)°+(1+i)=(1+6i-9)+(1+i)=-7+7i 

程序 代码 很 简单 ， 与 本 章 前 述 代 码 类 似 ， 只 有 一 个 不 同 之 处 ; 实现 算术 方法 的 代码 使 用 
了 一 种 新 的 机 制 来 访问 对 象 值 。 

访问 相同 类 型 的 其 他 对 象 的 实例 变量 。 实 例 方 法 plus() 和 times() 的 实现 需要 访问 两 
个 对 象 中 的 值 : 作为 参数 传递 的 对 象 和 调用 方法 的 对 象 。 当 客户 端 调用 aplus (b) 时 ， 可 
以 像 往常 一 样 使 用 名 称 re 和 im 来 访问 对 象 a 的 实例 变量 。 为 了 访问 b 的 实例 变量 ， 可 以 
使 用 代码 bre 和 b.im。 将 实例 变量 声明 为 private 意味 着 不 能 直接 从 另 一 个 类 访问 实例 变 
量 。 但 是 ,在 同一 个 类 中 , 可 以 直接 访问 任何 对 象 的 实例 变量 ,而 不 仅仅 是 调用 者 的 实例 
变量 。 

创建 并 返回 新 的 对 象 。 观 察 plus() 和 times() 向 客户 端 提供 返回 值 的 方式 就 会 发 现 : 它 
们 需要 返回 一 个 新 的 Complex 值 ， 因 此 ， 它 们 各 自 计 算 所 需 的 实 部 和 虚 部 ， 并 使 用 实 部 和 
虚 部 创建 一 个 新 对 象 ， 然 后 返回 该 对 象 的 引用 。 通 过 操作 Complex 类 型 的 局 部 变量 ， 这 种 
设计 使 得 客户 程序 可 以 按照 更 自然 的 方式 处 理 复数 。 

方法 调用 链 。 在 main() 方 法 中 ， 我 们 将 两 个 方法 调用 成 一 个 紧凑 的 Java 表达 式 
z.times(z).plus(z0)， 对 应 于 数学 表达 式 2+zo。 这 种 用 法 很 方便 ， 因 为 我 们 不 必 为 中 间 值 创建 
变量 名 称 。 也 就 是 说 ,我 们 可 以 使 用 任何 对 象 引 用 来 调用 一 个 方法 ,即使 没有 名 称 ( 如 子 表 
达 式 的 计算 结果 )。 研 究 该 表达 式 就 会 发 现 ， 这 种 方式 没有 歧义 : 方法 的 调用 从 左 向 右 移 动 ， 
每 个 方法 都 会 返回 对 Complex 对 象 的 引用 ， 该 对 象 用 于 调用 链 中 的 下 一 个 实例 方法 。 如 果 
需要 ， 我 们 可 以 使 用 圆 括号 来 覆盖 默认 的 优先 顺序 〈 例 如， Java 表达 式 z.times (z.plus (z0 ) ) 
对 应 于 数学 表达 式 z (z+zo) )。 

Final 类 型 实例 变量 。Complex 中 的 两 个 实例 变量 是 fnal 类 型 的 ， 这 意味 着 每 个 Complex 
对 象 的 值 是 在 创建 时 设置 的 ， 并 且 在 对 象 的 整个 生命 周期 中 不 会 变化 。 我 们 在 3.3 节 讨 论 这 
个 设计 的 原因 。 

复数 是 应 用 数学 中 复杂 计算 的 基础 ， 应 用 十 分 广泛 通过 Complex, 我 们 可 以 专注 于 开 
发 使 用 复数 的 应 用 程序 ， 而 不 用 担心 重新 实现 诸如 times()、abs() 等 方法 。 这 种 方法 实现 一 
次 ,就 可 以 重复 使 用 ， 而 不 需要 将 这 些 代码 复制 到 任何 使 用 复数 的 应 用 程序 中 。 这 种 方法 不 
仅 可 以 节省 调试 时 间 ; 还 可 以 根据 需要 对 实现 方式 进行 更 改 或 改进 ， 因 为 方法 与 客户 程序 是 
分 开 的 。 在 计算 中 应 当 清 晰 地 分 离 数 据 和 相关 的 计算 任务 。 为 了 体验 复数 计算 的 本 质 和 复数 
抽象 的 应 用 ， 接 下 来 我 们 将 讨论 一 个 著名 的 Complex 客户 程序 示例 。 

曼 德 布 洛 特 集合 ” 曼 德 布 洛 特集 合 (Mandelbrot set) 是 由 本 华 . 曼 德 布 洛 特 ( Benoit 
Mandelbrot) 发 现 的 一 组 特定 的 复数 。 这 个 集合 有 许多 有 趣 的 属性 。 它 是 一 个 分 形 图 案 ， 与 
本 书 中 我 们 已 经 看 到 的 巴 恩 斯 利 蕨 、 谢 尔 宾 斯 基 三 角形 、 布 朗 桥 、 科 赫 曲 线 、 醇 酒 的 海 怨 和 
其 他 递归 〈 自 相似 ) 模式 和 程序 有 关 。 这 种 模式 可 以 在 各 种 自然 现象 中 找到 ， 这 些 模型 和 程 
序 在 现代 科学 中 有 着 重要 的 作用 。 

曼 德 布 洛 特集 合 中 的 点 集 不 能 用 简单 的 数学 方程 来 描述 ， 只 能 由 一 种 算法 定义 ， 因 此 ， 
非常 适合 于 实现 为 复数 类 的 客户 程序 : 我 们 通过 编写 一 个 绘制 图 形 的 程序 来 研究 曼 德 布 洛 
特集 合 。 

确定 一 个 复数 是否 属于 曼 德 布 洛 特集 合 的 规则 很 简单 。 假设 有 复数 序列 zo，zi， 
2，…，2…， 其 中 如 果 z=(z) ?+z0o。 例 如 ， 下 面 表格 列举 了 当 zo=1+i 时 ， 序列 中 的 前 几 项 
元 素 : S 
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程序 3.2.6 复数 


Wl class Complex 


private final double re; 站 加 
private final double im; m| 虚 部 


public Complex(double real, double imag) 
{ re= real; im = imag; 


nk Complex te b) 
/ 人 阁 加 这 个 族 罕 和 b 的 
ble real = re + py re; 
gouble imag = im + b.im; 
. return new Complex(real, imag) ; 
public Complex times(Complex b) 
{ 7/ 返回 这 个 数字 和 b 的 乘积 
double real = re * b.re - im * b.im; 
double imag = re * b.im + imi* b.re; 
return new Complex(real, imag); 


. 


public double absO) 
{ return Math.sqrt(re*re + im*im); } 


public double reO { return re; } 
public double imO { return im; } 


public String toStringO) 
{ return re+"+" 


+ im+ "i"; } 
9 static void main(String[] args) 


Complex z0 = new Complex(1.0, 1.0); 
Complex z = 2z0; 

z = Zz.times(z).plus(z0); 

z= Zz.times(z).plus(z0); 

StdOut .println(z); 

















Lo Lok. oi (1 .sd ) 


1 | Ge i 2 a 6+ 61+ (Li sl 
2 49 一 98i 十 49i2 —98i+ (1+i) = 1- 97i 
x 
曼 德 布 洛 特 序列 计算 


现在 ， 如 果 序 列 |zl| 发 散 到 无 穷 大 ， 则 zo 不 属于 曼 德 布 洛 特集 合 。 如 果 序 列 有 边界 ， 则 
20 属于 曼 德 布 洛 特集 合 。 对 许多 复数 值 执行 这 个 测试 很 简单 ， 但 在 很 多 情况 下 测试 需要 大 量 
的 计算 ， 如 下 表 所 示 : 





2 |0+00 -2 十 由 有 0+i 一 0.5 二 0i 一 0.10 一 0.64i 

党 0 6 i a Dh ir 300 

FE 0 38 庆生 在 2 一 0.44 一 0.40 一 0.18i 

EA 0 1446 np = -0 和 1 0.23 一 0.50i 

人 0 2090918 ”一 9407 一 193i < 一 0.40 一 0.09 一 0.87i 
in set?| yes no no yes yes yes 
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为 了 简单 起 见 ， 上 表 最 右边 两 列 数 据 仅 保留 两 位 小 数 的 精度 。 在 某 些 情况 下 ， 我 们 可 以 
证 明 数 值 是 否 属于 曼 德 布 洛 特集 合 。 例 如 ，0+0i 
当然 在 集合 中 (因为 其 序列 中 所 有 数 的 模 数 都 是 
0 )， 而 2+0i 显然 不 在 集合 中 (因为 序列 中 数 的 模 
数 为 前 一 个 的 平方 加 2， 最 终 会 增长 到 无 限 大 )。 
在 有 些 情 况 下 ， 增 长 的 趋势 也 是 显而易见 的 。 例 
如 ，1+i 似乎 也 不 在 集合 中 。 也 有 的 序列 表现 出 
周期 性 行为 特征 。 例 如 ，0+i 的 序列 在 -1+i 和 =-i 
之 间 交 蔡 变 化 。 有 些 序列 会 持续 很 长 时 间 后 ， 数 
值 的 模 数 才 会 开始 变 大 。 

为 了 可 视 化 曼 德 布 洛 特集 合 ， 我 们 对 复数 点 
进行 采样 ， 与 绘制 实数 函数 时 使 用 的 采样 方法 一 
致 。 每 个 复数 x+ip 对 应 于 平面 上 的 一 个 坐标 点 
(x, y)， 所 以 可 以 按照 以 下 方法 绘制 结果 : 对 于 一 个 给 定 的 分 辩 率 nn, 我们 将 给 定 的 正方 形 
区 域 划 分 为 一 个 均匀 分 布 的 nXn 像素 网 格 ， 并 且 如 果 对 应 点 属于 曼 德 布 洛 特 集合 ， 则 把 对 
应 的 像素 绘制 成 黑色 ， 否 则 就 绘制 成 白色 。 绘制 结果 是 一 个 神奇 的 图 案 , 所 有 的 黑色 点 连接 
在 一 起 ， 大 致 落 在 以 点 -1/2+0i 为 中 心 的 2X2 正 方形 之 内 。n 值 越 大 ， 产生 的 图 像 分 辨 率 越 
高 ， 但 代价 是 需要 更 多 的 计算 量 。 通 过 观察 ， 可 以 发 现 所 绘图 像 的 自 相似 性 。 例 如 ， 在 主要 
的 黑色 心 形 区 域 的 轮廓 周围 ， 出 现 自 相似 的 相同 的 球状 图 案 作为 附属 ， 其 大 小 与 程序 1.2.1 
的 简单 标尺 功能 相似 。 当 我 们 放大 心 形 边缘 附近 时 ,会 出 现 微 小 的 自 相 似 心 形 图 ! 

但 是 ， 究 竟 是 如 何 产生 这 种 情况 的 呢 ? 事实 上 ， 没 有 人 知道 准确 答案 ， 因 为 没有 一 个 简 
单 的 测试 可 以 让 我 们 得 出 这 样 一 个 结论 : 一 个 点 确实 在 集合 中 。 给 定 一 个 复数 点 ， 我 们 可 以 计 
算 序 列 的 前 几 项 ， 但 可 能 无 法 确定 序列 是 否 有 边界 。 存 在 一 个 简单 的 数学 测试 ， 可 以 用 于 判断 
一 个 复数 不 在 集合 中 : 如 果 序 列 中 存在 任何 一 个 数 的 模 超 过 2 (如 1+3i)， 那 么 序列 肯定 发 散 。 

Mandelbrot (程序 3.2.7 ) 使 用 这 个 测试 来 绘制 曼 德 布 洛 特集 合 的 可 视 化 图 形 。 由 于 集合 
的 点 不 能 仅仅 使 用 黑 或 白 两 种 颜色 表示 ， 因 此 我 们 在 可 视 化 表示 中 使 用 了 灰 度 。 计 算 曼 德 布 
洛 特 集合 规则 的 函数 是 mand0， 该 函数 的 参数 是 复数 z0 和 int 型 的 max， 从 z0 开始 计算 曼 
德 布 洛 特 迭 代 序 列 ， 返 回 模 数 保持 小 于 (或 等 于 ) 2 的 迭代 次 数 ， 直 到 极限 max。 

对 于 每 个 像素 ，Mandelbrot 中 的 main() 方法 计算 与 该 像素 对 应 的 复数 z0， 然 后 通过 计 
算 255-mand(z0,255) 为 该 像素 创建 灰 度 颜色 值 。 任 何 一 个 像素 都 对 应 于 一 个 复数 ， 如 果 这 个 
复数 不 在 曼 德 布 洛 特集 合 中 ， 那 么 它 不 是 黑色 的 ， 因 为 它 的 序列 中 数字 的 模 数 超过 了 2 ( 因 
此 会 发 散 到 无 穷 大 )。 黑 色 像 素 点 〈 灰 度 值 0 ) 对 应 于 我 们 假定 属于 集合 的 点 ， 因 为 在 首 个 
255 次 的 曼 德 布 洛 特 迭 代 期 间 ， 其 模 数 不 超过 2。 

这 个 简单 的 程序 产生 的 图 像 极其 复杂 ， 即 使 放大 平面 图 像 的 一 部 分 也 是 如 此 。 如 果 要 获 
得 更 奇妙 的 显示 效果 ， 我 们 可 以 绘制 一 个 彩色 的 图 ( 见 练习 3.2.35 )。 曼 德 布 洛 特集 合 仅 通 
过 迄 代 一 个 简单 的 函数 ftz)=(z?+zo) 而 来 ， 我 们 也 可 以 研究 其 他 这 样 的 函数 ， 获 取 更 丰富 的 
效果 和 特性 。 

代码 的 简单 性 掩盖 了 计算 的 复杂 性 。 在 512X512 大 小 的 图 像 中 约 有 25 万 像素 ， 而 
所 有 黑色 像素 点 需要 255 次 曼 德 布 洛 特 迭 代 ， 所 以 用 Mandelbrot 生成 一 幅 图 像 ， 需 要 对 
Complex 值 进行 数 以 百 万 计 的 操作 。 


i 
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虽然 展示 的 效果 很 炫 ， 但 我 们 对 Mandelbrot 的 主要 兴趣 在 于 它 是 利用 Complex 实现 的 
一 个 示例 客户 程序 ， 用 来 说 明 使 用 未 内 置 在 Java 中 的 数据 类 型 (复数 ) 进行 计算 也 是 一 种 自 
然 且 实 用 的 编程 活动 。 得 益 于 Complex 的 设计 和 实现 ，Mandelbrot 中 的 客户 代码 是 一 个 简 
单 而 自然 的 计算 表达 式 。 你 也 可 以 在 不 使 用 Complex 的 情况 下 实现 Mandelbrot， 但 是 代码 
本 质 上 必须 将 程序 3.2.6 和 程序 3.2.7 中 的 代码 合并 在 一 起 ， 这 将 更 加 难以 理解 。 正 应 了 我 们 
前 面 说 的 : 在 计算 中 应 当 清 晰 地 分 离 数 据 和 相关 的 计算 任务 。 








程序 3.2.7 ” 曼 德 布 洛 特集 合 





import java.awt.Color; 
















public class Mandelbrot z0 Xtiy 
2 二 : 清 max: 二 友 代 次 数 上 限 
re static int mand(Complex z0, int max) xc， yc | 正方形 的 中 心 点 
Complex z = z0; size | 正方 形 的 规定 尺寸 
for (int t = 0; t < max; t++) n 网 格 是 n xn 像 索 


if (z.abs() > 2.0) return t; Wo 输出 的 图 像 


z = Zz.times(z).plus(z0); 5 输出 的 像素 颜色 
return max; 六 
=- 


public static void main(String[] args) 


double xc = Double.parseDouble(args[0]); 
double yc = Double.parseDouble(args[1]); 
double size = Double.parseDouble(args[2]); 
int n= 512; 

“Picture picture = new Picture(n, n); 

for (int 1 =0; i < nj i++) 
for“Cint j= 0; j “< n; j++) 
{ 















double x0 = xc - size/2 + size*i/n; -1015 =-.633 .01 
double y0 = yc - size/2 + size*j/n; 
Complex z0 = new Complex(x0,; y0); 

int gray = 255 - mand(z0, 255); 

Color c = new Color(gray, gray, gray); 
picture.set(i, n-1-j, Cc); 


picture.show(); 








该 程序 接收 三 个 命令 行 参数 来 指定 正方 形 区 域 的 中 心 和 大 小 ， 并 以 数字 
图 像 的 形式 ， 显 示 在 均匀 分 布 像素 的 区 域 中 曼 德 布 洛 特集 合 的 采样 结果 。 通 过 
计算 相应 复数 的 曼 德 布 洛 特 序列 的 近代 次 数 ， 确 定 每 个 像素 的 灰 度 值 ， 最 大 值 
为 255。 
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商业 数据 处 理 面向 对 象 程序 设计 的 开发 推动 力 之 一 是 大 量 用 于 商业 数据 处 理 的 可 靠 
软件 的 需求 。 作 为 说 明 ， 我 们 接 下 来 将 讨论 一 个 金融 机 构 可 能 用 来 跟踪 客户 信息 的 数据 类 型 
的 例子 。 . 

假设 证 券 经 纪 人 需要 维护 客户 账户 信息 ， 包 括 各 种 股票 的 份额 。 也 就 是 说 ,证券 经 纪 
人 需要 处 理 的 一 系列 数据 包括 : 客户 名 称 、 持 有 的 不 同 股票 数量 、 每 只 股票 的 代码 和 份额 
以 及 手头 的 现金 数量 。 为 了 处 理 一 个 账户 信息 ， 证 券 经 纪 人 至 少 需要 定义 如 下 API 对 应 的 
运算 操作 : 


public class StockAccount 


StockAccount(String filename) 在 文件 中 创建 一 个 新 的 账户 
double valueOf() 账户 总 额 





void buy(int amount, String symbol1) 将 股票 的 股份 添加 到 账户 
void sell(int amount, String Symbol1) 从 账户 中 减 去 股 要 的 份额 
void save(String filename) 保存 账户 到 文件 


void printReport() 打印 股票 和 价值 的 详细 报告 
处 理 股票 账户 的 API ( 见 程序 3.2.8 ) 


很 显然 ， 证 券 经 纪 人 需要 买 人 股票 、 卖 出 股票 和 向 客户 提供 报表 ,但 理解 此 类 数据 处 理 
的 首要 任务 是 考虑 API 中 的 StockAccount() 构造 函数 和 save() 方法 。 客 户 信 息 必 须 长 久保 
存 ， 所 以 需要 保存 在 文件 或 数据 库 中 。 为 了 处 理 一 个 账户 ， 客 户 端 程序 需要 从 相应 的 文件 中 
读 取 信息 : 根据 需求 处 理 信息 ; 并 且 如 果 信息 发 生 更 改 ， 则 将 信息 写 回 文件 ， 并 保存 文字 以 
备 后 用 。 为 了 实现 此 类 处 理 ， 我 们 需要 一 个 用 于 存储 账户 信息 的 文件 格式 和 一 个 在 内 存 中 的 
内 部 表述 方式 (或 一 个 数据 结构 )。 

作为 一 个 (异想天开 的 ) 例子 ， 我 们 想象 证 券 经 纪 人 正在 管理 计算 之 父 艾 伦 . 图 灵 
(Alan Turing) 的 软件 公司 的 部 分 股票 投资 份额 。 顺 便 说 一 句 : 图 灵 的 生平 故事 是 一 个 值得 
进一步 了 解 的 有 趣 的 故事 。 比 如 他 从 事 过 计算 密码 学 的 研究 ， 大 大 加 速 了 第 二 次 世界 大 战 的 
结束 ; 他 为 现代 理论 计算 机 科学 发 展 奠 定 了 基础 ， 设 计 和 制造 了 第 一 台 计 算 机 ; 他 还 是 人 工 
智能 研究 的 先驱 者 。 也 许可 以 假设 ,在 20 世纪 中 叶 ， 无 论 图 灵 作 为 一 名 学 术 研究 人 员 的 财 
务 状况 如 何 ， 只 要 他 投资 小 部 分 资产 ， 就 可 以 足够 乐观 地 估计 其 对 当代 计算 机 软件 的 潜在 巨 
大 影响 。 

文件 格式 。 现 代 系统 通常 使 用 文本 文件 (即使 是 数据 ) 以 最 小 化 程 % more Turing.txt 
序 对 格式 的 依赖 。 为 了 简单 起 见 ， 我 们 使 用 直接 的 表示 方法 ， 罗 列 账户 107209， an 
持 有 人 的 名 字 (一 个 字符 串 )、 现 金 余 额 (一 个 浮 点 数 ) 和 持 有 的 股票 数 4 
量 (一 个 整数 )， 随 后 每 个 股票 信息 占 一 行 (包括 股票 份额 和 股票 代码 )， 100 ADBE 
如 右 图 所 示 。 使 用 如 <Name>、<Number of shares> 等 标签 标记 所 有 数 ” 25 G00G 
据 其 实 是 个 明智 之 举 ， 这 样 可 以 进一步 减少 程序 对 数据 的 依赖 。 但 为 了 97 IBM 
简洁 起 见 ， 示 例 中 忽略 了 这 些 标签 。 rg 

数据 结构 。 为 了 表示 Java 程序 处 理 的 信息 ， 我 们 使 用 实例 变量 。 
实例 变量 指定 了 信息 的 类 型 ， 并 提供 了 代码 中 需要 引用 的 结构 。 例 如 ， 为 了 实现 我 们 的 例子 
需要 以 下 实例 变量 : 
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一 个 表示 账户 名 称 的 字符 串 值 。 
一 个 表示 现金 余额 的 浮 点 数值 。 
一 个 表示 股票 数量 的 整数 值 。 
一 个 表示 股票 代码 的 字符 串 数组 。 
一 个 表示 股票 份额 的 整数 数组 。 

我 们 在 StockAccount (程序 3.2.8 ) 的 实例 变量 声明 部 public class StockAccount 
分 实现 了 这 些 变 量 的 设计 。 数 组 stocks[] 和 shares[] 被 称 { ee. 
为 平行 数组 。 对 于 给 定 的 索引 i，stocks[i] 表示 股票 代码 ， private double cash 
shares[i] 表示 账户 中 该 股票 的 持 有 份额 。 一 种 替代 的 设计 private int ni 
是 ， 为 股票 定义 一 个 单独 的 数据 类 型 ， 在 StockAccount 中 Private SI 9 es 
创建 该 数据 类 型 的 对 象 数 组 以 操作 每 种 股票 的 信息 。 

StockAccount 包含 一 个 构造 函数 ， 用 于 以 指定 的 格式 
读 取 一 个 文件 ， 并 用 这 些 信息 创建 一 个 账户 。 此外， 经 纪 全 人 全 
人 需要 向 客户 提供 周期 性 的 详细 报表 ， 经 纪 人 可 使 用 StockAccount 中 的 printReport() 代码 ， 
依靠 StockQuote (程序 3.1.8 ) 从 Web 上 检索 每 个 股票 的 价格 。 


public void printReport() 


StdOut.printin(name); 
double total = cash; 
for (int 1 = 0: 1 < ny i++) 
{ 
int amount = shares[i]; 
double price = StockQuote.priceOf(stocks[i]); 
total += amount * price; 
StdOut.printf("%4d %5s ", amount, stocks[i]); 
StdOut.printf("%9.2f %11.2f\n", price, amount*price); 
a AN) 2f\n se Cash: Ju Cash),; 
StdOut.printf("%21s %10.2f\n", "Total:", total); 

} 

valueOf() 和 save() 函数 的 实现 很 简单 (参见 练习 3.2.22 )。buy( 和 sell0 的 实现 需要 使 
用 4.4 节 介 绍 的 基本 机 制 ， 所 以 我 们 将 其 推迟 到 练习 4.4.65 中 再 做 讨论 。 

一 方面 ， 这 个 客户 程序 展示 了 一 种 计算 模式 ， 该 模式 是 20 世纪 50 年 代 计算 演变 的 主 
要 推动 力 之 一 。 银 行 和 其 他 公司 正 是 因为 需要 做 这 样 的 财务 报告 而 购买 了 早期 的 计算 机 。 例 
如 ， 格 式 化 的 输出 就 是 为 这 样 的 应 用 程序 而 开发 的 。 另 一 方面 ， 这 个 客户 程序 是 现代 的 以 网 
络 为 中 心计 算 的 一 个 示例 ， 因 为 其 直接 从 网 上 获取 信息 ， 而 不 通过 Web 浏览 器 。 

除了 这 些 基 本 的 方法 之 外 ， 实 现 这 些 设计 理念 的 实际 应 用 可 能 会 使 用 其 他 许多 客户 程 
序 。 例 如 ;证 券 经 纪 人 可 能 希望 为 所 有 账户 创建 一 个 数组 ， 然 后 修改 这 些 账户 信息 ， 并 通过 
网 站 实际 提交 这 些 交 易 。 当 然 ， 实 现 这 种 功能 的 代码 需要 非常 谨慎 ! 

当 你 在 第 2 章 中 学 习 如 何 定义 在 一 个 程序 (或 其 他 程序 ) 的 多 个 地 方 使 用 的 函数 后 ， 你 
就 已 从 单个 文件 中 简单 语句 序列 的 程序 世界 进入 模块 化 编程 的 世界 ， 总 结 成 我 们 的 程序 设计 
理念 就 是 : 在 计算 中 应 当 尽 可 能 清晰 地 将 计算 任务 划分 成 相互 独立 的 子 任务 。 与 之 相 比 ， 本 
章 介绍 的 数据 类 型 引导 读者 从 少量 内 置 数据 类 型 的 世界 进入 一 个 可 以 自 定 义 数 据 类 型 的 世 
界 。 这 种 新 能 力 意义 深远 ， 极 大 地 扩展 了 读者 的 编程 范围 和 能 力 。 就 像 函数 的 概念 一 样 ， 一 
且 你 学 会 了 实现 和 使 用 数据 类 型 ， 你 会 发 现 不 使 用 自 定 义 数据 类 型 的 程序 十 分 粗糙 和 原始 。 
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程序 3.2.8 ”股票 账户 





public class StockAccount 


private final String name; name 顾客 姓名 


private double cash; cash 现金 余额 
private int ni n 股票 数量 
private int[] shares; shares[f] | 份额 计数 


private String[] stocks; stocks[] | 股票 的 符号 
public StockAccount(String filename) pm em me 
{ 扩 从 指定 的 文件 电机 建交 玫 第 构 
In in = new In(filename); 
name = in.readLine(); 
cash = in.readDouble(); 
n = in.readIntO; 
shares = new int[n]; 
stocks = new String[n]; 
for (Cint i = 0; i < n; i++) 
{ 7 处 理 股票 
shares[i] = in.readInt(); 
stocks[i] = in.readString(); 


中 
public static void main(String[] args) 
{ 


StockAccount account = new StockAccount(args[0]); 
account.printReport(); 
} 
3 








这 个 类 用 于 处 理 股票 账户 。 这 个 类 说 明了 用 于 商业 数据 处 理 的 面向 对 象 
编程 的 典型 用 法 。 有 关 priceOf() 、save(0)、buy0 和 sell0 的 实现 在 练习 3.2.22 和 
4.4.65 中 详细 讨论 ， 关 于 printReport0) 请 阅读 本 节 中 的 相关 内 容 。 


% more Turing.txt ' % java StockAccount Turing.txt 

Turing, Alan Turing, Alan 

10.24 100 ADBE 70.56 7056.00 
4 25 GO0G 502.30 12557.50 
100 ADBE 97 ‘TBM 156,54 SR 
25 GOOG 250 MSFT 45.68 11420.00 
97 IBM Cash: 10.24 
250 MSFT 


Total: 46228.12 


但 是 ;面向 对 象 编程 序 设计 不 止 于 结构 化 数据 。 面 向 对 象 程序 设计 可 以 把 数据 和 相关 子 
任务 通过 运算 操作 相关 联 ， 并 将 两 者 分 开 保存 在 独立 的 模块 中 。 通过 面向 对 象 的 程序 设计 ， 
我 们 的 设计 理念 是 这 样 的 : 在 计算 中 应 当 清 晰 地 分 离 数据 和 相关 的 计算 任务 。 

我 们 考虑 过 的 例子 就 是 有 说 服 力 的 证 据 ， 说 明 面 向 对 象 的 程序 设计 方法 可 以 广泛 应 用 于 
编程 活动 。 无 论 是 设计 和 构建 物理 工件 、 开 发 软件 系统 、 理 解 自然 界 ， 还 是 处 理 信 息 ， 首 要 步 
又 都 是 定义 适当 的 抽象 ， 如 物理 对 象 的 几何 描述 、 软 件 系 统 的 模块 化 设计 、 自 然 世界 的 数学 
模型 以 及 信息 的 数据 结构 。 当 我 们 想 编写 程序 来 操作 定义 好 的 抽象 的 实例 时 ， 我 们 可 以 把 数 
据 抽象 实现 为 Java 类 中 的 一 个 数据 类 型 ， 然 后 编写 Java 程序 来 创建 和 操作 这 种 类 型 的 对 象 。 

每 次 我 们 开发 一 个 类 ， 并 使 用 其 他 类 创建 和 操作 由 该 类 定义 的 数据 类 型 的 对 象 时 ， 我 们 
就 是 在 更 高 抽象 层面 上 编写 程序 :在 下 一 节 中 ， 我 们 将 讨论 这 类 编程 中 固有 的 一 些 设计 挑战 5 


问答 环节 
问 : 实例 变量 是 否 具 有 默认 初始 值 ? 
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答 : 是 的 。 对 于 数字 类 型 ， 它 们 自动 设置 为 0, 布尔 类 型 为 false， 所 有 引用 类 型 都 为 
null。 这些 值 与 Java 自动 初始 化 数组 元 素 的 方式 一 致 。 这 种 自动 初始 化 确保 每 个 实例 变量 总 
是 保存 一 个 有 效 的 〈 但 不 一 定 有 意义 的 ) 值 。 编 写 代码 时 依赖 于 初始 化 值 是 有 和 争议 的 : 一 些 
有 经 验 的 程序 员 支 持 这 个 想法 ,因为 代码 可 能 会 更 加 紧凑 (省 去 了 程序 员 手 动 填写 0、false、 
null 等 初 值 的 工作 一 一 译 者 注 ); 还 有 一 部 分 人 则 主张 避免 这 种 情况 ， 因 为 对 于 不 了 解 初始 
化 规则 的 人 来 说 代码 是 不 透明 的 。 

问 : 什么 是 null ? 

答 : 这 是 一 个 字符 常量 ， 表 示 没 有 对 象 。 使 用 null 引用 来 调用 实例 方法 是 没有 意义 的 ， 
并 导致 NullPointerException 异常 。 通 常情 况 下 ， 这 是 一 个 标志 ， 表 示 用 户 未 能 正确 初始 化 
一 个 对 象 的 实例 变量 或 数组 元 素 。 

问 : 当 我 声明 实例 变量 时 ， 是 否 可 以 将 其 初始 化 为 默认 值 以 外 的 值 ? 

答 : 如 果 需 要 ， 你 可 以 在 构造 函数 中 将 实例 变量 初始 化 为 非 默 认 值 。 与 局 部 变量 的 内 联 
初始 化 的 规定 类 似 ， 可 以 在 声明 实例 变量 时 为 其 指定 初始 值 。 此 内 联 初始 化 在 构造 函数 被 调 
用 之 前 发 生 。 

问 : 每 个 类 都 必须 有 一 个 构造 阴 数 吗 ? 

答 : 是 的 ， 但 是 如 果 不 指 定 构 造 孔 数 ，Java 将 自动 提供 一 个 默认 的 (没有 参数 ) 构造 函 
数 。 当 客户 端 使 用 new 调用 这 个 构造 函数 时 ， 实 例 变 量 像 往 常 一 样 自动 初始 化 。 如 果 用 户 
指定 了 一 个 构造 函数 ， 那 么 默认 的 无 参数 构造 函数 就 会 自动 失效 。 

问 : 假设 不 引入 toString() 方法 ， 而 尝试 使 用 StdOut.println() 打印 该 类 型 的 对 象 ， 会 发 
生 什么 情况 ? 

答 : 这 时 ， 打 印 输出 的 结果 是 一 个 对 用 户 不 太 有 用 处 的 整数 。 

问 : 可 以 在 一 个 数据 类 型 中 定义 静态 方法 吗 ? 

答 : 当然 可 以 。 例 如 ， 所 有 的 类 都 有 main() 方 法。 但 是 当 静 态 方法 和 实例 方法 混在 同 
一 个 类 中 时 ， 很 容易 混淆 。 例 如 ， 对 于 涉及 多 个 对 象 的 操作 ;而 在 这 些 操作 中 ， 没 有 一 个 对 
象 能 够 很 自然 地 作为 发 起 者 调用 该 方法 ， 那 么 就 会 考虑 使 用 静态 方法 。 例 如 ， 我 们 写 z.abs() 
来 得 到 |z| 非常 自然 ,但 是 写 a.plus(b) 来 进行 一 次 atb 的 操作 也 许 并 不 那么 自然 。 为 什么 不 
用 b.plus(a) ? 另 一 种 方法 是 在 Complex 中 定义 如 下 静态 方法 : 


public static Complex plus(Complex a, Complex b) 


return new Complex(a.re + b.re, a.im + b.im); 


我 们 通常 会 避免 这 种 用 法 ， 并 且 使 用 不 会 混用 静态 方法 和 实例 方法 的 表达 式 。 例 如 我 们 
通常 会 避免 编写 如 下 代码 : 


z = Complex:plus(Complex.times(z, z), z0) 

相反 ， 我 们 会 写 : 

z = z.times(z) .plus(z0) 

问 : 使 用 plus() 和 times( 的 计算 看 起 来 相当 烦琐 。 有 什么 方法 可 以 在 涉及 对 象 (例如 


Complex 和 Vector) 的 表达 式 中 使 用 像 “+” 和 “*” 这 样 的 符号 ， 以 便 可 以 编写 更 紧凑 的 
表达 式 。 如 .z=z *z+z0。 


答 : 一 些 语言 (特别 是 C++ 和 了 Python) 支持 这 种 功能 。 这 种 实现 方式 被 称 为 运算 符 重 
载 ， 但 Java 不 支持 。 像 之 前 的 一 些 情 况 一 样 ， 这 是 由 语言 设计 者 决定 的 ， 但 是 许多 Java 程 
序 员 并 不 认为 这 是 一 个 很 大 的 损失 。 运 算 符 重 载 仅 适用 于 表示 数值 或 代数 抽象 的 类 型 ， 占 总 
数 的 很 小 一 部 分 ， 而 许多 程序 调用 具有 描述 性 名 称 的 方法 (如 plus() 和 times()) 则 更 便于 理 
解 。20 世纪 70 年代 的 APE 编程 语言 ， 通 过 坚持 每 一 个 操作 都 用 一 个 符号 (包括 希腊 字母 ) 
来 表示 的 方法 ， 把 这 个 问题 推 到 了 另 一 个 极端 ， 十 分 难以 理解 。 

问 : 在 类 中 ， 除 了 参数 变量 、 局 部 变量 和 实例 变量 之 外 ， 是 否 还 存在 其 他 类 型 的 变量 ? 

答 : 如 果 将 static 关键 字 包 含 在 变量 声明 中 (不 在 任何 方法 中 )， 则 会 创建 一 个 完全 不 同 
类 型 的 变量 ， 称 为 静态 变量 或 类 变量 。 像 实例 变量 一 样 ， 静 态 变 量 可 以 被 类 中 的 每 个 方法 访 
问 ,， 但 是 ， 它 们 不 与 任何 对 象 关联 一 一 每 个 类 只 有 一 个 变量 副本 。 在 较 老 的 编程 语言 中 ， 这 
样 的 变量 由 于 其 作用 范围 是 整个 程序 而 被 称 为 全 局 变量 。 在 现代 编程 中 ， 我 们 往往 注意 限制 
变量 的 范围 ， 所 以 很 少 使 用 这 样 的 变量 。 

问 : Mandelbrot 创建 了 数 以 亿 计 的 Complex 对 象 。 请 问 这 种 创建 对 象 的 开销 是 否 会 使 
程序 变 慢 ? 

答 : 是 的 ， 但 不 会 缓慢 到 无 法 生成 绘图 。 我 们 的 目标 是 通过 复杂 的 数字 抽象 来 使 得 我 们 
的 程序 易 读 、 易 维护 。 通 过 复数 抽象 限制 范围 可 以 帮助 我 们 实现 上 述 目标 。 当 然 ， 可 以 不 通 
过 复杂 的 数字 抽象 或 使 用 Complex 的 不 同 实 现 来 加 速 Mandelbrot。 


练习 


3.2.1 阅读 以 下 矩形 (与 坐标 轴 平 行 ) 的 数据 类 型 的 实现 代码 ， 其 使 用 中 心 点 的 坐标 位 置 、 宽 度 和 高 
度 来 表示 每 个 矩形 : 





public class Rectangle 


private final double x, y; // 矩形 的 中 必 s 
private final double width; 1/ 抢 形 的 宽 
private final double height;  // 矩形 的 高 


public Rectangle(double x0, double y0, double w, double h) 
‘ 


Xx 去 X03, 训 示 

y = y0; 

width = w; (sy) 
height = h; 高 


} 
public double areaO) 
{ return width * height; } 


宽 
public double perimeter(Q) 
{ 从 计算 周 长 刀 } 相交 (me rs 
public boolean intersects(Rectangle b) 
{ 庆 这 个 矩形 是 否 和 bb 相交? 榴 } 
public boolean contains(Rectangle b) 包含 
{ 从 b 在 这 个 矩形 里 面 吗 ? */ } 
public void draw(Rectangle b) 
放 在 标准 图 形 上 绘制 矩形 。*/ } 

3 


请 编写 该 类 的 API， 完 成 该 类 的 实现 代码 ， 包 括 perimeter()、intersects() 和 contains()。 注 
意 : 如 果 两 个 矩形 有 一 个 或 多 个 公共 点 (不 正确 的 交点 )， 将 视 为 相交 。 因 而 ，a.intersects(a) 和 


322 


326 


3.2.7 


3.2.8 
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a.contains(a) 都 为 True。 418 
请 编写 一 个 Rectangle 测试 客户 程序 ， 它 需要 三 个 命令 行 参数 n、min 和 max。 生 成 mn 个 随机 和 矩 

形 ， 其 宽度 和 高 度 均匀 分 布 在 min 和 max 之 间 。 在 标准 绘图 窗 日 绘制 这 些 和 矩形 ， 在 标准 输出 中 
输出 其 平均 面积 和 周 长 。 

将 前 面 的 练习 代码 添加 到 测试 客户 程序 ， 以 计算 彼此 相交 或 包含 的 矩形 对 的 平均 数量 。 

请 编写 练习 3.2.1 中 Rectangle API 的 一 种 实例 ， 使 用 和 矩 形 的 左下 角 和 右上 角 的 x 和 y 坐标 表示 

和 矩形。 保持 API 不 变 。 

以 下 代码 有 什么 错误 ? 


public class Charge 


二 
private double rx, ry;  // 位 置 
private double q; // charge 值 


public Charge(double x0, double y0, double q0) 
和 

double rx = x0; 

double ry = y0; 

double q = q0; 
} 


答案 : 构造 函数 中 的 赋值 语句 也 是 声明 ， 它 们 会 创建 新 的 局 部 变量 rx、ry 和 q， 这 些 变量 
在 构造 函数 完成 时 超出 了 范围 (不 可 用 )。 实 例 变量 rx、ry 和 q 仍然 是 其 默认 值 0。 注 意 : 与 实 
例 变 量 名 称 相同 的 局 部 变量 被 称 为 映射 实例 变量 。 我 们 将 在 下 一 节 讨 论 引 用 映射 实例 变量 ， 初 
学 者 最 好 避免 这 种 情况 。 
创建 一 个 数据 类 型 Location， 使 用 纬度 和 经 度 代表 地 球 上 一 个 位 置 。 实 现 方法 distanceTo()， 用 
来 使 用 大 圆 距 离 来 计算 球 上 两 点 间 的 距离 (请 参见 练习 1.2.33 ) 。 419 
实现 一 个 数据 类 型 Rational， 支 持 加 减 乘 除 操作 。 


public class Rational 








Rational(int numerator, int denominator) 


Rational plus(Rational b) 这 个 数字 和 b 的 和 
Rational minus(Rational b) 这 个 数字 和 b 的 差 
Rational times(Rational b) 这 个 数字 和 b 的 乘积 
Rational divides(Rational b) 这 个 数字 和 b 的 商 
String toString() 字符 串 表示 


使 用 Euclid.gcd0 (程序 2.3.1 ) 来 确保 分 子 和 分 母 没有 公 因 子 。 请 包含 一 个 可 以 执行 所 有 
方法 的 测试 客户 程序 。 不 用 考虑 整数 溢出 的 情况 (参见 练习 3.3.17 )。 
编写 一 个 数据 类 型 Interval 实现 以 下 API: 


public class Interval 


Interval(double left, double right) 


boolean contains(double x) x 是 否 在 这 个 区 间 中 ? 
boolean intersects(Interval b) 这 个 区 间 和 b 是 否 相 交 ? 


String toString() 字符 串 表示 
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一 个 区 间 被 定义 为 一 条 线段 上 大 于 或 等 于 left 但 小 于 或 等 于 right 的 所 有 点 的 集合 ， 特 别 要 

说 明 的 是 ， 当 right 小 于 left 时 ， 区 间 为 空 集 。 编 写 二 个 客户 程序 (作为 过 滤器 )， 从 命令 行 接 
收 一 个 浮 点 数 x 作为 命令 行 参 数 ， 在 标准 输入 上 读 入 一 系列 区 间 ， 每 个 区 间 由 一 对 double 值 表 
示 ， 输 出 所 有 包含 x 的 区 间 。 

3.2.9 ”为 前 一 个 练习 中 的 Interval 类 编写 一 个 客户 程序 ， 这 次 从 命令 行 读 人 整数 型 参数 mn， 从 标准 输入 
中 读 取 n 个 区 间 (每 个 区 间 由 一 对 double 值 定 义 )， 并 打印 所 有 相交 的 区 间 对 。 

3.2.10， 针 对 练习 3.2.1， 使 用 Interval 数据 类 型 开发 一 个 Rectangle 的 API 实现 ， 使 代码 的 表达 更 加 简 

化 和 清晰 。 
3.2.11 编写 一 个 数据 类 型 Point， 实 现 以 下 API: 


public class Point 





Point(double x, double y) 


double distanceTo(Point q) 此 点 与 之 间 的 欧 氏 距离 
String toStringO 字符 串 表示 


3.2.12 ”给 Stopwatch 添加 新 的 方法 ， 人 允许 客户 程序 停止 并 重新 启动 秒表 。 

3.2.13 ”使 用 Stopwatch 比较 两 种 计算 谐 波 数 的 方法 的 时 间 开 销 : 使 用 for 循环 结构 ( 见 程 序 1.3.5 ) 的 
方法 与 2.3 节 中 给 出 的 递归 方法 。 

3.2.14 “请 利用 Draw 开发 一 个 新 的 Histogram 程序 ， 客 户 程 序 可 以 创建 多 个 直方 图 。 在 显示 图 上 , 在 
采样 均值 的 位 置 添加 一 条 红色 的 垂直 线 ， 在 显示 距离 样本 均值 有 两 个 标准 偏差 距离 处 添加 一 
条 蓝 色 垂 直线 。 同 时 实现 一 个 测试 客户 程序 ， 用 于 为 翻转 硬币 ( 伯 努 利 试验 ) 创建 直方 图 ， 用 
偏转 概率 为 p 的 偏向 硬币 ，p=0.2、0.4、0.6 和 0.8， 从 命令 行 中 获得 翻转 次 数 和 试验 次 数 ， 如 
程序 3.2.3 所 示 。 

3.2.15 ”修改 Turtle 中 的 测试 客户 程序 ， 把 一 个 奇数 n 作为 命令 行 参数 ， 用 n 个 点 绘制 一 个 星 形 。 

3.2.16 ”修改 Complex (程序 3.2.6 ) 中 的 toString() 方法 ， 使 用 传统 格式 输出 复数 。 例 如 ; 复数 3-i 应 
该 输出 为 3-i 而 不 是 3.0+-1.0i; 复数 3i 输出 为 3i， 而 不 是 0.0+3.0is 

3.2.17 ”编写 一 个 Complex 客户 程序 ， 它 以 三 个 浮 点 数 a、b 和 作为 命令 行 参数 ， 并 打印 ax?*+bx+tc 的 
两 个 (复数 ) 根 。 

3.2.18 ”编写 一 个 Complex 客户 程序 Roots， 程 序 在 命令 行 中 接收 两 个 浮 点 数 a、b 和 一 个 整数 nx， 并 
打印 出 atbi 的 n 次 方 根 。 注 意 : 如 果 读 者 不 熟悉 复数 的 根 的 求 值 操作 ， 请 跳 过 本 练习 。 

3.2.19 ”实现 下 列 Complex 的 API 扩展 : 


double theta() 这 个 数字 的 相位 ( 角度 ) 
Complex minus(Complex b) 这 个 数字 和 b 的 差 
Complex conjugateO) 这 个 数字 的 共 斩 
Complex divides(Complex b) 把 这 个 数字 除 以 b 的 结果 
Complex power(int b) 这 个 数字 的 b 次 寡 


写 一 个 测试 客户 程序 ， 测 试 所 有 方法 。 
3.2.20 ”假设 你 想 给 Complex 类 增加 一 个 构造 函数 ， 其 参数 为 double 型 ， 并 创建 一 个 以 该 值 作为 实 部 
(而 不 管 虚 部 ) 的 复数 。 编 写 以 下 代码 : 


public void Complex(double real) 
{ 
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= real; 
= 0.0; 


但 是 ， 接 下 来 Complex c=new Complex(1.0) 的 声明 语句 编译 不 通过 。 为 什么 ? 
答案 : 构造 函数 不 具有 返回 类 型 ， 其 至 void 都 不 可 以 加 。 这 段 代码 定义 了 一 个 名 为 
Complex 的 方法 ， 而 不 是 一 个 构造 函数 。 应 该 删除 关键 字 void。 
3.2.21 ”找到 一 个 Complex 型 的 值 ， 使 得 mand() 函数 的 返回 值 大 于 100， 然 后 放大 该 值 ， 如 本 书 中 的 
示例 。 
3.2.22 ”实现 StockAccount (程序 3.2.8 ) 的 valueOf() 和 save0 方法 。 


创新 练习 


3.2.23 ”电热 可视化。 编写 一 个 程序 Potential， 根 据 标准 输入 (每 a Sarges. nt 


个 带电 粒子 由 其 x 坐标 、y 坐标 和 电荷 值 指定 ) 创建 一 个 “.51 . 
带电 粒子 数组 ， 并 产生 单位 正方 形 中 电势 的 可 视 化 效果 。 “30 


50 
对 单位 正方 形 中 的 点 进行 采样 ， 对 于 每 个 采样 点 ， 计算 “.33 . 
该 点 的 电势 (通过 对 每 个 带电 粒子 产生 的 电位 进行 求 和 )， 70 
并 将 相应 点 绘制 成 与 电势 成 比例 的 灰色 阴影 。 .82 





3.2.24 ”可 变 电 荷 。 修 改 Charge (程序 3.2.1 )， 使 电荷 值 q 可 变 ， .90 . 
并 且 添 加 一 个 方法 increaseCharge()， 它 接受 一 个 浮 点 型 ”% java Potential < charges.txt 
的 参数 ， 并 把 给 定 的 值 添 加 到 q 上 。 然 后 编写 一 个 客户 一 组 电荷 值 的 电势 可 视 化 
程序 ， 初 始 化 数组 : 


Charge[] a = new Charge[3]; 

a[0] = new Charge(0.4, 0.6, 50); 
a[1] = new Charge(0.5, 0.5, -5); 
a[2] = new Charge(0.6, 0.6, 50); 


接 下 来 ， 显 示 如 果 缓 慢 减 小 afi] 电荷 值 后 的 结果 ， 通 过 以 下 循环 结构 代码 实现 图 像 的 计算 : 


forrCint t = 0; t < 100; .t++) 
{ 
1/- 重 新 计算 图 中 相应 的 值 并 重 绘 
picture.show() ; 
a[1l].increaseCharge(-2.0); 





改变 粒子 的 电荷 值 


3.2.25 用 于 复数 的 秒表 。 编 写 一 个 Stopwatch 客户 程序 用 于 计算 程序 运行 的 时 间 开 销 ， 用 以 比较 
Mandelbrot 程序 不 同 实现 方案 的 计算 时 间 ; 一 种 方案 是 使 用 Complex 实现 的 ， 另 一 种 方案 是 
直接 操纵 两 个 浮 点 数 的 方法 实现 的 。 具 体 来 说 ， 请 创建 一 个 只 执行 计算 的 Mandelbrot 版 本 
(删除 引用 Picture 的 代码 )， 然 后 创建 一 个 不 使 用 Complex 的 程序 版 本 ， 并 计算 它们 运行 时 间 
的 比值 。 
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3.2.26 


$2.27 


3.2.28 


.2:29 


.2.30 
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四 元 数 。1843 年 ， 威 廉 . 汉密尔顿 栈 士 发 现 了 一 个 复数 的 扩展 ， 称 之 为 四 元 数 。 四 元 数 是 一 
个 向 量 a= (ao，al!，a;，a;)， 其 计算 公式 如 下 : 
。 模 : |al= aBtalta3ta3 
。 共 轧 : a 的 共 轿 是 (ao -au -az -a3) 
。 道 : a !=(ao/|al*, -ai/lal’, -az/lal®, -as/lal’) 
e 和 : a+b=(aot+bo, ait+bi, a2+b2, a3+b;) 
e 点 积 : aXb=(ao bo-ai bi-az by-as b3, ao bi-a! bo-a; bs-asb;, ao by-ai bsta; botas bi, ao bstail 
b2—az bitas bo) 

。 商 : a/b=ab” 

为 四 元 数 创建 一 个 数据 类 型 Quaternion， 并 为 你 的 代码 创建 一 个 测试 客户 程序 。 四 元 
数 将 三 维 旋转 的 概念 推广 到 四 维 ， 它 们 被 用 于 计算 机 图 形 学 、 控 制 理 论 、 信 和 号 处 理 和 轨道 
力学 。 
龙 形 曲线 。 写 一 个 递归 的 Turtle 客户 程序 Dragon， 绘 制 龙 形 曲线 ( 见 练习 1.2.35 和 练习 1.5.9 ) 。 

答案 : 这 些 曲线 最 初 是 由 NASA 的 三 位 物理 学 家 发 现 的 ， 
由 马丁 .加 德 纳 (Martin Gardner) 在 20 世纪 60 年 代 推广 , 随 % java Dragon 15 
后 被 克 莱 顿 (Michael Crichton ) 在 电影 《 侏 罗 纪 公园 》(Jurassic 
Park) 中 使 用 。 这 个 练习 可 以 用 非常 紧凑 的 代码 来 实现 ， 基 
于 一 对 直接 从 练习 1.2.35 中 得 到 的 相互 作用 的 递归 函数 。 其 
中 一 个 函数 dragon() 用 于 绘制 期 望 的 龙 形 曲线 ， 另 一 个 函数 
nogard() 用 于 以 相反 的 顺序 绘制 曲线 。 详 情 请 参阅 本 书 官网 。 
希 尔 伯 特 曲线 。 空 间 填充 曲线 是 穿 过 每 个 点 的 单位 正方 形 中 的 
连续 曲线 。 编 写 一 个 递归 的 Turtle 客户 程序 创建 这 种 递归 图 
案 ， 这 就 是 数学 家 大 卫 : 希 尔 伯 特 (David Hilbert) 在 19 世纪 未 定义 的 空间 填充 曲线 。 


1 2 4 
部 分 答案 : 设计 一 对 相互 递归 的 方法 : hilbert() 用 于 遍历 希 尔 伯 特 曲线 ，treblih() 则 用 于 


以 相反 的 顺序 遍历 希 尔 伯 特 曲线 。 详 情 请 参阅 本 书 网 站 。 
Gosper 岛 。 写 一 个 递归 的 Turtle 客户 程序 ， 产 生 这 些 递归 模式 。 


0 1 2 3 4 
化 学 元 素 。 为 元 素 周 期 表 中 的 条 目 创建 一 个 数据 类 型 ChemicalElement。 数 据 类 型 包含 元 素 、 
原子 序数 、 和 符号、 原子量 以 及 这 些 值 的 访问 方法 。 然 后 创建 一 个 数据 类 型 PeriodicTable， 它 





本 2 3 


2 


Ee 


3.2.34 


3 


人 
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从 文件 中 读 取 数 值 来 创建 一 个 ChemicalElement 对 象 矩 阵 (可 以 在 本 书 网 站 上 找到 该 文件 及 其 
格式 描述 )， 程 序 响 应 来 自 标准 输入 的 查询 ， 用 户 可 键入 一 个 分 子 式 如 H20， 程序 响 应 并 输出 
分 子 量 。 请 分 别 为 两 种 数据 类 型 开发 API 并 完成 其 实现 。 

数据 分 析 。 编 写 一 个 数据 类 型 ， 用 于 运行 实验 ， 其 控制 变量 的 范围 是 [0，z) 内 的 一 个 整数 ， 
因 变 量 是 一 个 浮 点 数 〈( 例 如， 研究 带 一 个 整数 参数 的 程序 的 运行 时 间 会 涉及 此 类 实验 )。 实 现 
以 下 API: 


public class Data 





DataCint n, int max) 创建 一 个 新 的 数据 分 析 对 象 
对 于 [0,， 癌 中 的 na 个 整数 值 
double addDataPoint(int 1, double x) 添加 一 个 数据 点 (i， 认 
void plotPoints() 绘制 所 有 的 数据 点 


使 用 StdStats 中 的 静态 方法 进行 统计 计算 并 绘制 图 形 。 编 写 一 个 测试 客户 程序 ， 当 网 格 大 
小 增加 时 ， 绘 制 渗 透 原理 实验 的 运行 测试 结果 (渗透 概率 )。 
股票 价格 。 本 书 网 站 中 的 文件 DJIA.csv 包含 了 自 有 记录 以 来 道琼斯 工业 平均 指数 的 所 有 收盘 
价格 ， 使 用 逗号 分 隔 文件 格式 。 请 编写 一 个 数据 类 型 DowJonesEntry， 它 可 以 保存 表 中 的 一 个 
条 目 ， 包 括 日 期 、 开 盘 价 格 、 最 高 价格 、 最 低 价格 、 收 盘 价格 等 。 然 后 再 编写 一 个 数据 类 型 
DowjJones， 从 文件 中 读 取 数据 以 创建 DowJonesEntry 对 象 数 组 ， 并 提供 计算 任意 时 间 跨 度 平 
均值 的 方法 。 最 后 ,创建 有 趣 的 DowJones 客户 程序 ， 产 生 数 据 的 绘制 图 形 。 请 读者 发 挥 自己 
的 创造 力 : 这 个 过 程 会 充满 乐趣 。 
最 大 的 赢家 和 最 大 的 输家 。 编 写 一 个 StockAccount 的 客户 程序 ， 构 建 一 个 StockAccount 对 象 
的 数组 ， 计 算 每 个 账户 的 资金 总 额 ， 并 输出 具有 最 大 值 和 最 小 值 的 账户 的 报表 信息 。 假 设 账 
户 中 的 数据 按照 文中 给 出 的 格式 保存 在 一 个 单独 的 文件 中 ， 这 个 文件 包含 了 账户 的 信息 。 
牛顿 迭代 解 方程 之 混沌 情况 。 多 项 式 ftz)=z'-1 有 四 个 根 1、-1、i 和 -i。 我 们 可 以 在 复数 平 
面 上 用 牛顿 法 求解 多 项 式 的 根 : zwi=ze-ftzp)/f"(zD)。 其 中 ，flz)=z*-1， 了 (z)=4z*。 该 方法 根据 初 
始点 zo 收敛 到 四 个 根 之 一 。 请 编写 一 个 Complex 和 Picture 的 客户 程序 NewtonChaos， 它 接受 
一 个 命令 行 参数 n， 并 创建 一 个 与 以 原点 为 中 心 的 边 长 为 2 的 正方 形 相对 应 的 nXn 图 片 。 根 
据 相 应 点 收敛 于 四 个 根 中 的 哪 一 个 而 为 对 应 像素 着 色 为 白 、 红 、 绿 或 者 蓝 色 (如果 在 100 次 迭 
代 之 后 没有 收敛 则 赋予 像素 点 黑色 ) 。 
曼 德 布 洛 特 的 彩色 绘图 。 创 建 一 个 包含 256 个 整数 三 元 组 的 文件 ， 代 表 一 些 有 趣 的 颜色 值 ， 
然后 使 用 这 些 颜 色 代 替 灰 度 值 来 绘制 Mandelbrot 中 的 每 个 像素 。 读 取 这 些 值 ， 并 创建 包含 
256 个 Color 值 的 数组 ， 然 后 使 用 mand() 的 返回 值 作为 数组 索引 下 标 从 数组 中 提取 这 些 值 用 
于 绘图 。 请 通过 试验 在 曼 德 布 洛 特集 合 中 的 不 同位 置 尝试 不 同 颜色 选择 ， 来 制作 出 一 张 令 人 
惊叹 的 图 像 。 请 参阅 本 书 网 站 中 提供 的 mandel.txt。 
朱 痢 姓 集 合 。 复 数 c 的 朱 痢 娅 集合 ( Julia set) 是 与 Mandelbrot 函数 相关 的 点 集 。 这 次 我 们 固 
定 c 并 改变 z， 而 不 是 固定 z 而 改变 c。 点 z 如 果 对 于 修改 后 的 曼 德 布 洛 特 函 数 能 够 有 界 ， 则 
属于 朱 莉 娅 集合 。 如 果 序 列 发 散 到 无 穷 大 ， 则 不 属于 朱 莉 娅 集合 。 所 有 相关 的 点 位 于 以 原点 
为 中 心 的 4X4 的 框 中 。 当 且 仅 当 c 在 曼 德 布 洛 特集 合 中 时 ,< 的 朱 莉 娅 集合 才 是 连通 的 ! 编 
写 一 个 程序 ColorJulia， 它 接收 两 个 命令 行 参数 a 和 b， 使 用 上 一 个 练习 中 描述 的 颜色 表 方 法 ， 
绘制 c=a+bi 的 朱 莉 娅 集合 的 彩色 图 像 。 
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3.3 ”设计 数据 类 型 


创建 数据 类 型 的 能 力 使 得 每 个 程序 员 都 变 成 一 个 语言 设计 者 。 我 们 不 再 局 限于 处 理 内置 
于 语言 中 的 数据 类 型 和 相关 操作 ， 而 是 可 以 很 容易 地 创建 自己 的 数据 类 型 并 编写 相应 的 客户 程 
序 。 例 如 ，Java 没有 预定 义 的 复数 数据 类 型 ， 但 是 你 可 以 定义 Complex 数据 类 型 ， 并 编写 客户 
程序 ， 如 Mandelbrot。 同 样 ，Java 没有 内 置 的 海龟 绘图 工具 ， 但 是 我 们 可 以 定义 Turtle 并 编写 
客户 程序 以 便 立 即 利用 这 个 抽象 。 即 使 Java 确实 包含 了 一 个 特定 的 工具 ， 我 们 也 可 能 更 喜欢 根 
据 自 己 的 特定 需求 创建 单独 的 数据 类 型 ， 就 像 我 们 自 定 义 Picture、In、Out 和 Draw 等 类 型 一 样 。 

基于 上 述 观 点 ， 编 写 一 个 程序 时 ， 首 要 任务 就 是 尽量 理解 我 们 需要 的 数据 类 型 。 程 序 开 
发 在 此 时 变 为 一 项 设计 活动 。 在 本 节 中 ， 我 们 特别 关注 API 的 开发 ， 它 是 任何 程序 开发 的 
关键 步 又。 我 们 需要 考虑 不 同 的 选择 方案 ， 了 解 其 对 客户 程序 和 实现 的 影响 ， 并 不 断 优 化 设 
计 方 案 ， 以 在 客户 需求 和 可 能 的 实现 策略 之 间 寻 求 平衡 。 

如 果 你 选修 了 系统 编程 课程 ， 那 么 会 了 解 这 种 设计 任务 是 构建 大 型 系统 的 关键 行为 ， 并 
且 在 编写 大 型 程序 时 ，Java 及 其 他 类 似 语言 包含 强大 的 高 层 机 制 ， 支 持 编 写 大 型 程序 时 的 代 
码 复 用 。 这 些 机 制 中 有 许多 是 面向 构建 大 型 系统 的 专家 而 设计 的 ， 但 其 一 般 方法 也 适用 于 所 
有 的 程序 员 ， 其 中 一 些 机 制 适用 于 编写 小 型 程序 。 

在 本 节 中 ， 我 们 将 讨论 封装 、 不 变性 和 继承 ， 关 注 这 些 设计 理念 在 数据 类 型 设计 中 的 应 
用 ， 以 实现 模块 化 程序 设计 ， 便 于 调试 程序 ， 提 高 编写 清晰 而 正确 的 代码 的 效率 。 

在 本 节 最 后 ， 我 们 将 讨论 一 种 重要 的 Java 运行 时 机 制 ， 用 于 检查 设计 时 的 假设 与 实际 
运行 时 的 条 件 是 否 匹 配 。 这 些 功 能 对 于 开发 可 靠 软件 具有 宝贵 的 价值 。 

设计 API 在 3.1 节 ， 我 们 编写 了 使 用 API 的 客户 程序 。 在 3.2 节 ， 我 们 实现 了 API。 
现在 我 们 讨论 设计 API 时 的 挑战 。 按 照 上 述 顺 序 来 讨论 这 些 主题 是 比较 恰当 的 ， 因 为 程序 
设计 花费 的 大 部 分 时 间 主 要 在 于 编写 客户 程序 。 

通常 ， 构 建 软件 最 重要 和 最 具 挑战 性 的 步骤 是 设计 API。 这 个 任务 需要 不 断 实 践 、 深 思 
熟 虑 和 多 次 迭代 。 但 是 ， 设 计 一 个 好 的 API 所 花 的 时 间 肯 定 会 在 调试 或 代码 复 用 时 得 到 及 
时 的 回报 。 

编写 小 型 程序 时 黄 酌 API 似乎 没有 必要 ,但 应 该 考虑 到 你 编写 的 程序 也 许 将 来 在 编写 
其 他 程序 时 可 以 复 用 一 一 不 是 因为 你 知道 你 将 使 用 哪 段 代码 ， 而 是 因为 你 极 可 能 希望 将 复 用 
某 些 代码 , 但 只 是 目前 无 法 确定 是 哪些 代码 。 

标准 。 通 过 与 其 他 领域 的 类 比 ， 我 们 可 以 很 容易 地 理解 为 什么 编写 API 是 如 此 重要 。 
从 火车 铁轨 到 螺纹 螺母 和 螺栓 ， 到 MP3 ， 再 到 无 线 电 频率 和 Internet 标准 ， 我 们 了 解 到 遵循 
一 个 常用 的 标准 接口 可 以 促进 一 项 技术 的 广泛 应 用 。Java 本 身 也 是 一 个 例子 : 用 户 编写 的 
Java 程序 是 Java 虚拟 机 的 客户 程序 ，Java 虚拟 机 是 一 个 在 众多 硬件 和 软件 平台 上 实现 的 标 
准 接口 ， 因 此 Java 程序 可 以 “一 处 编译 ， 多 处 执行 ” 。 通 过 使 用 API 将 客户 程序 与 实现 分 
离 ， 在 编写 的 每 个 程序 中 ， 我 们 都 能 得 到 标准 接口 带 来 的 收益 。 

规范 问题 。 数 据 类 型 的 API 包含 若干 方法 和 这 些 方法 所 提供 功能 的 简单 描述 。 在 理想 情 
况 下 ,API 将 在 规范 (specification) 中 明确 描述 针对 所 有 可 能 的 参数 会 产生 的 行为 及 其 副作用 ， 
然后 编写 软件 来 检查 API 的 实现 是 否 满足 了 所 描述 规范 的 要 求 。 不 幸 的 是 ， 理 论 计算 机 科学 
的 一 个 基本 结论 表明 : 这 个 目标 事实 上 是 无 法 实现 的 ， 这 个 问题 被 称 为 规范 问题 (specification 
problem)。 简 而 言 之 ， 这 种 类 型 的 规范 说 明 应 该 使 用 形式 语言 描述 ， 如 程序 设计 语言 (那么 ， 
按照 这 样 的 规则 ， 规 范 也 就 变 成 了 一 段 程序 一 一 译 者 注 )。 同 时 ， 确 定 两 个 程序 是 否 执行 了 相 
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同 计算 的 问题 在 数学 上 是 不 可 解 的 (如 果 读 者 对 这 个 观点 感 兴趣 ， 可 以 通过 学 习 一 门 称 为 “ 理 
论 计算 机 科学 ”的 课程 ,更 多 地 了 解 不 可 解 问题 的 本 质 及 其 对 理解 计算 的 本 质 起 到 的 作用 )。 
因此 ， 我 们 只 能 通过 示例 进行 非 形式 化 的 描述 ， 就 像 我 们 写 在 API 前 后 的 描述 文字 一 样 。 

客户 程序 





cl.potentialAt(x, y) 


创建 对 象 
并 调用 方法 
API 





public class Charge 


Charge(double x0, double y0, double q0) 


double potentialAt(double x, double y) A 


String toString() 字符 串 表 示 





定义 签名 并 
描述 方法 


public Charge(double x0, double y0, double q0) 
站 


public double potentialAt(double x, double y) 
i 

public String toString() 

ia 





定义 实例 变量 
并 实现 方法 
面向 对 象 的 数据 类 型 抽象 


宽 接口 。 宽 接口 是 指 包含 的 方法 非常 多 的 接口 。 设 计 API 需 要 遵循 的 一 个 重要 原则 是 避免 
宽 接 口 。API 的 规模 一 般 会 随 着 时 间 的 推移 自然 而 然 地 增长 ， 因 为 向 现 有 API 添加 方法 很 容易 ， 
然而 删除 方法 又 不 破坏 现 有 客户 程序 是 很 困难 的 。 在 某 种 情况 下 ， 宽 接口 也 是 合理 的 。 例 如 ， 
广泛 使 用 的 系统 库 (如 String) 中 就 存在 大 量 方法 。 多 种 技术 有 助 于 减少 接口 的 有 效 宽度 。 一 
种 途径 是 仅 包含 功能 上 相互 正 交 的 方法 ( 即 无 法 借助 别 的 方法 实现 的 方法 一 一 译 者 注 )。 例 如 ， 
Java 的 Math 库 包 含 正弦 、 余 弦 和 正切 的 三 角 函 数 ， 但 不 包括 正 割 和 余 割 。 

从 客户 代码 开始 。 开 发 数据 类 型 的 主要 目的 之 一 是 简化 客户 代码 。 因 此 ， 当 开始 设计 一 
个 API 的 时 候 ， 就 关注 客户 代码 是 有 意义 的 。 通 常 ， 在 编写 实现 之 前 编写 客户 代码 是 明智 
的 。 当 我 们 发 现 客户 代码 过 于 烦琐 时 ， 解 决 这 个 问题 的 一 种 方法 是 写 一 个 简化 版 本 的 代码 来 
表示 思考 和 计算 的 过 程 。 或 者 ， 如 果 你 已 经 编写 了 描述 计算 过 程 的 简明 注释 ， 一 个 可 能 的 出 
发 点 是 考虑 将 注释 转换 成 代码 。 
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避免 对 表示 方式 的 依赖 。 通 常情 况 下 ， 当 开发 一 个 API 时 ， 我们 在 心中 会 考虑 其 表示 
430| 方式 


。 上 毕 竞 ， 一 个 数据 类 型 是 一 组 值 和 定义 在 这 组 值 上 的 一 系列 操作 的 集合 ， 在 不 知道 值 的 
前 提 下 讨论 操作 是 没有 意义 的 。 然 而 ， 这 与 确定 值 的 表示 是 不 同 的 概念 。 我 们 使 用 数据 类 型 
的 一 个 目的 是 ， 使 得 客户 代码 独立 于 数据 的 具体 表现 细节 ， 从 而 实现 代码 简化 。 例 如 ， 我们 
的 Picture 和 StdAudio 的 客户 程序 只 关注 图 像 和 声音 的 简单 抽象 表示 。 这 些 抽象 API 的 主要 
价值 在 于 允许 客户 代码 仅 关注 标准 的 抽象 方法 ， 而 忽略 这 些 抽 象 方法 背后 的 大 量 细节 。 

API 设计 中 的 陷阱 。 一 个 API 可 能 难以 实现 ， 这 意味 着 : 实现 API 的 过 程 十 分 困难 或 不 
可 能 完成 ; 也 可 能 太 难 使 用 ， 这 是 指 创建 的 客户 代码 比 没有 使 用 API 的 更 复杂 。API 可 能 太 
窄 ， 忽 略 了 客户 程序 需要 的 方法 ; API 可 能 太 宽 ， 包 括 大 量 客户 程序 不 需要 的 方法 。API 可 能 
太 笼 统 ， 提 供 了 没有 用 处 的 抽象 ; API 可 能 太 具 体 ， 提 供 的 抽象 太 详 细 或 太 分 散 以 至 于 不 可 
用 。 上 述 思 想 有 时 也 可 以 总 结 成 另 一 种 设计 理念 : 向 客户 程序 提供 其 所 需 的 方法 ， 仅 此 而 已 。 

当 你 第 一 次 开始 编程 的 时 候 ， 你 只 需要 输入 HelloWorld.java 就 可 以 了 ， 除 了 其 产生 的 
结果 之 外 ， 你 不 用 理解 它 。 从 那 时 起 ， 你 通过 模仿 本 书 代 码 来 学 习 程序 设计 ， 最 终 开 发 自己 
的 代码 来 解决 各 种 问题 。 设 计 API 的 过 程 也 是 一 样 的 。 本 书 、 本 书 官网 以 及 Java 在 线 文档 
中 包含 许多 可 供 学 习 和 使 用 的 API， 以 增强 读者 自己 设计 和 开发 API 的 信心 。 

封装 ”通过 隐藏 信息 将 客户 程序 与 接口 实现 分 离 的 过 程 称 为 封装 。 实 现 的 细节 对 于 客户 
程序 来 说 是 隐藏 的 ， 实 现 也 无 从 了 解 客 户 代 码 的 详细 信息 ， 事 实 上 客户 代码 是 后 来 才 编 写 的 。 

你 可 能 已 经 猜 到 ， 我 们 一 直 在 数据 类 型 的 实现 中 使 用 封装 。 在 3.1 节 中 ， 我 们 从 “你 不 
需要 知道 数据 类 型 是 如 何 实现 的 ”这 个 设计 理念 开始 。 这 个 设计 理念 描述 了 封装 的 一 个 主 
要 优点 。 我 们 认为 这 是 非常 重要 的 ， 因 此 没有 向 读者 描述 任何 其 他 设计 数据 类 型 的 方式 。 现 
在 ,我 们 将 详细 地 解释 使 用 封装 的 三 个 主要 原因 。 使 用 封装 的 目的 如 下 : 

。 启用 模块 化 编程 。 

。 便于 调试 。 

。 使 程序 代码 更 清晰 可 读 。 

这 些 原因 是 联系 在 一 起 的 (精心 设计 的 模块 化 代码 比 在 长 程序 中 完全 基于 基本 类 型 的 代 
码 更 容易 调试 和 理解 )。 

模块 化 编程 。 从 第 2 章 开始 ， 开 发 中 的 编程 风格 强调 了 一 种 程序 设计 理念 ， 即 把 大 型 程 
序 分 解 为 可 以 独立 开发 和 调试 的 小 型 模块 。 这 种 方法 通过 将 修改 程序 的 影响 限制 在 局 部 范围 
增强 了 软件 的 弹性 ， 通 过 使 用 数据 类 型 替代 新 实现 提高 了 性 能 和 准确 度 ， 改 进 了 内 存 占用 ， 
更 提高 了 代码 复 用 。 这 一 想法 在 许多 环境 中 都 有 效 。 当 使 用 系统 模块 的 时 候 ， 我 们 经 常 从 
封装 中 获 益 。 新 版 本 的 Java 系统 通常 包含 各 种 数据 类 型 的 新 实现 ,但 原 有 的 API 不 会 改变 ， 
因此 原 有 的 程序 不 需要 修改 就 可 以 使 用 新 的 Java 系统 库 。 改 进 数 据 类 型 的 实现 具有 强烈 和 
持续 的 推动 力 ， 因 为 所 有 的 客户 程序 都 可 以 从 改进 中 获 益 。 模 块 化 编程 成 功 的 关键 在 于 保持 
模块 之 间 的 独立 性 。 我 们 之 所 以 这 样 做 是 认为 API 是 客户 程序 和 实现 之 间 的 唯一 依赖 关系 。 
使 用 一 个 数据 类 型 时 无 须 理 解 其 具体 实现 。 这 个 设计 理念 的 意思 是 数据 类 型 的 实现 可 以 假设 
客户 程序 除了 API 之 外 对 数据 类 型 一 无 所 知 。 

示例 。 例 如 ,我们 可 以 看 程序 Complex (程序 3.3.1 )， 它 与 程序 3.2.6 有 相同 的 名 称 和 
API， 但 对 复数 使 用 不 同 的 表示 形式 。 程 序 3.2.6 使 用 笛 卡 儿 表 示 ， 其 中 实例 变量 x 和 y 表示 
复数 x+tiy。 程 序 3.3;1 使 用 极 坐 标 表示 法 ， 其 中 复数 用 实例 变量 rz 和 theta， 以 r(cosb+ising) 的 
形式 表示 。 极 坐标 表示 是 有 意义 的 ， 因 为 某 些 运算 (如 乘法 和 除法 ) 中 使 用 极 坐 标 表示 的 复数 
更 有 效率 。 封 装 的 思想 是 ,我 们 可 以 用 其 他 程序 蔡 换 这 些 程序 (无 论 出 于 何 种 原因 ) 而 无 须 更 
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政客 户 代 码 。 两 种 实现 之 间 的 选择 取决 于 客户 程序 。 事 实 上 ,原则 上 对 于 客户 程序 的 唯一 区 
别 应 该 是 不 同 的 执行 性 能 。 这 种 能 力 至 关 重 要 ， 可 以 给 我 们 带 来 很 多 益处 。 其 中 最 重要 的 一 
点 是 ， 它 人 允许 我 们 不 断 地 改进 软件 : 当 我 们 开发 一 种 更 好 的 方法 实现 数据 类 型 时 ， 其 所 有 的 
客户 程序 都 将 受益 。 每 次 安装 新 版 本 的 软件 系统 (包括 Java 本 身 ) 时 ， 都 可 以 利用 这 项 特性 。 

私有 的 。Java 语言 对 强制 封装 的 实现 使 用 私有 访问 修饰 符 private。 当 我 们 声明 一 个 实例 
变量 (或 方法 ) 为 private 时 ;， 则 不 允许 所 有 客户 程序 ( 另 一 个 类 中 的 代码 ) 直接 访问 该 修饰 符 
修饰 的 实例 变量 (或 方法 )。 因 此 , :客户 程序 只 能 通过 公共 方法 和 构造 函数 (类 的 .API) 来 访问 
此 数据 类 型 。 因 此 ， 可 以 修改 API 的 实现 ， 以 使 用 不 同 的 私有 实例 变量 (或 者 重新 组 织 私 有 实 
例 方法 )， 而 且 确 信 不 会 直接 影响 客户 程序 。Java 并 不 要 求 所 有 的 实例 变量 都 是 私有 的 ， 但 是 
我 们 在 本 书 的 程序 中 坚持 使 用 这 个 约定 。 例如 ， 如 果 Complex (程序 3.2.6) 中 的 实例 变量 re 
和 im 是 公共 的 ， 则 客户 程序 可 以 编写 直接 访问 它们 的 代码 。 如 果 z 引 用 一 个 Complex 对 象 ， 
则 zre 和 zim 可 以 引用 这 些 值 。 但是, 任何 这 样 做 的 客户 代码 都 完全 依赖 于 该 实现 ， 违 反 了 
基本 的 封装 规范 。 如 果 换 成 不 同 的 实现 ， 如 程序 3.3.1 中 的 实现 ,会 导致 该 代码 无 效 。 为 了 避 
免 遇 到 这 种 情况 ， 我 们 总 是 将 实例 变量 设 为 私有 。 接 下 来 ,我 们 考察 这 个 约定 的 一 些 影响 。 


程序 3.3.1 复数 ( 另 一 种 实现 方式 ) 


public class Complex 
{ 
private final double ri; 法 于 
private final double theta; theta 


public Complex(double re, double im) 


r = Math.sqrt(re*re + im*im); 
theta = Math.atan2(im, re); 


public Complex plus(Complex b) 
~ 和 b 的 和 


return new Complex(real, imag); 


public Ee OE b) 
{ W 返回 这 个 数字 和 b 的 

double a = 

double angle = theta + theta; 
i / 参考 问答 环节 


public We absO) 
freturn r; } 


public double reO { return r * Math.cos(theta); } 
public double im() { return r * Math.sin(theta); } 


public String na 
{ return re() + nm 让 时 于 对 


public static void main(String[] se 
{ 


Complex z0 = new Complex(1.0, 1.0); 
Complex z = 2z0; 
Z = Zz.times(z).plus(z0); 
z= Zz.times(z).plus(z0); 
4 Stdout.println(Cz); 
} 


这 个 数据 类 型 实现 了 与 程序 3.2.6 相 同 的 API。 它 使 用 相同 的 实例 方法 但 使 用 
不 同 的 实例 变量 。 由 于 实例 变量 是 私有 的 ， 所 以 这 个 程序 可 以 用 来 代替 程序 3.2:6， 
而 无 须 改 变 任何 客户 端 代码 。 


% java Comp1ex 
-7.000000000000002 + 7.0000000000000031i 
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规划 未 来 。 众 多 例子 表明 ， 许 多 严重 的 后 果 可 以 直接 追溯 到 程序 员 没 有 封装 其 数据 
类 型 。 

。Y2K 问题 。 在 上 一 个 千年 ， 许 多 程序 为 了 节省 空间 仅 用 两 位 数字 来 表示 年 份 。 这 样 

的 程序 无 法 区 分 1900 年 和 2000 年 。 当 2000 年 1 月 1 日 临近 时 ， 程序 员 开 始 争 分 夺 
秒 地 修正 这 种 错误 ， 以 避免 许多 技术 人 员 所 预测 的 灾难 性 错误 。 

。 邮政 编码 。1963 年 ， 美 国 邮政 局 (USPS) 开始 使 用 5 位 邮政 编码 来 改善 邮件 的 分 类 
和 传送 。 程 序 员 编 写 的 软件 假定 邮政 编码 将 永远 保持 在 5 位 ， 并 在 程序 中 用 一 个 32 
位 的 整数 表示 它们 。1983 年 ， 美国 邮政 推出 了 名 为 ZIP+4 的 扩展 邮政 编码 ， 新 邮政 
编码 包含 原始 的 5 位 邮政 编码 并 附加 额外 的 4 位 数字 。 

。 IPv4 与 IPvV6。 互 联网 协议 (IP) 是 电子 设备 通过 互联 网 交换 数据 的 标准 。 每 个 设备 被 

分 配 一 个 唯一 的 整数 或 地 址 。IPv4 使 用 32 位 地 址 ， 支 持 约 43: 忆 个 地 址 。 由 于 互联 
网 的 爆炸 性 增长 ， 新 版 本 的 IPv6 使 用 128 位 地 址 ， 支 持 2” 个 地 址 。 

在 这 些 情况 下 ， 如 果 程 序 没 有 正确 地 封装 数据 ， 则 数据 内 部 的 改变 将 使 得 依赖 于 当前 标 
准 的 大 量 客户 代码 (因为 数据 类 型 没有 被 封装 ) 根本 就 不 能 按 预期 运行 。 上 述 案例 的 变动 成 
本 估计 高 达 数 亿美 元 ! 这 就 是 没有 封装 数值 所 带 来 的 巨大 代价 。 这 些 困境 对 你 来 说 可 能 很 禹 
远 , 但 是 可 以 肯定 的 是 ,任何 一 个 程序 员 (包括 你 自己 ) 如 果 没 有 充分 利用 数据 封装 的 预防 
措施 ， 都 有 可 能 在 标准 改变 的 时 候 花 费 大 量 的 时 间 和 精力 去 修复 失效 代码 。 

我 们 的 规则 是 : 所 有 实例 变量 都 是 private 访问 修饰 符 定义 的 私有 变量 ， 以 避免 上 述 问 
题 。 如 果 你 在 实现 数据 类 型 (如 年 份 、 邮 政 编 码 、IP 地 址 或 者 其 他 任何 数据 类 型 ) 时 采用 了 
这 种 规范 ， 就 可 以 更 改 其 内 部 表示 而 不 影响 客户 程序 的 运行 。 数 据 类 型 实现 对 数据 的 具体 表 
示 了 如 指 掌 ， 同 时 对 象 存储 数据 。 客 户 程序 仅仅 引用 一 个 对 象 ， 无 须知 道 细 节 。 

限制 潜在 的 错误 。 封 装 还 有 助 于 程序 员 确 保 其 代码 的 运行 结果 符合 预期 。 举 一 个 例子 ， 
我 们 考虑 另 一 个 可 怕 的 故事 : 在 2000 年 的 美国 总 统 选举 中 ， 戈 尔 在 佛罗里达 州 的 Volusia 县 
的 电子 投票 机 上 收 到 了 -16 022 票 。 其 原因 是 计数 器 变量 没有 正确 地 封装 在 投票 机 软件 中 ! 
为 了 理解 这 个 问题 ， 我 们 将 讨论 根据 下 面 的 API 实现 的 一 个 计数 器 (程序 3.3.2 ): 


public class Counter 


Counter(String id，int max) 创建 一 个 计数 器 ， 初 始 化 为 0 





void increment() 增加 计数 器 的 值 ， 除 非 它 的 值 已 是 最 大 值 max 
int value() 返回 计数 器 的 值 
String toString() 字符 串 表示 


计数 器 数据 类 型 的 API (参见 程序 3.3.2 ) 


这 种 抽象 适用 于 许多 情况 ， 如 电子 投票 机 。Counter 封装 了 一 个 整数 ， 并 确保 其 对 整数 
执行 的 唯一 操作 是 将 该 整数 递增 1。 因 此， 其 结果 永远 不 会 变 成 负数 。 数 据 抽 象 的 目标 是 限 
制 数据 的 操作 。 数 据 封装 还 能 隔离 数据 的 操作 。 例 如 ， 我们 可 以 增加 一 个 新 的 实现 ， 使 得 计 
数 器 具有 日 志 记 录 功 能 ，increment() 可 为 每 个 投票 记录 一 个 时 间 戳 或 其 他 可 用 于 检查 一 致 性 
的 信息 。 但 是 如 果 没 有 private 修饰 符 ， 在 投票 机 中 可 能 会 编写 如 下 客户 代码 : 


Counter c = new Counter("Volusia", VOTERS_ IN_ VOLUSIA COUNTY); 
c.count = -16022; 


在 使 用 private 强制 封装 的 程序 设计 语言 中 ， 类 似 这 样 的 代码 无 法 通过 编译 。 如 果 没 有 
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类 似 的 保护 ， 则 戈 尔 的 投票 计数 是 负 的 。 使 用 封装 并 不 能 完全 解决 投票 安全 问题 ， 但 这 是 一 
个 好 的 开始 。 







程序 3.3.2 计数 器 













public class Counter 


private final String name; name “| 计数 器 名 称 


private final int maxCount; maxCount | 最 大 值 
private int count; count -| 值 

















public Counter(String id, int max) 
{ name = id; maxCount = max; } 


public void increment() 
{ if (count < maxCount) count++; } 


public int valueQO) 
{ return count; } 


public String toString() 
{ return name + ": "+ Count; } 


public static void main(String[] args) 
2 






int n = Integer.parseInt(args[0]); 
int trials = Integer.parseInt(args[1]); 
Counter[] hits = new Counter[n]; 
for (Cint 1 = 0; i < ni i++) 
hits[i] = new Counter(i + "", trials); 
for (int t = 0; t < trials; t++) 
hits[StdRandom.uniform(n)].incrementQ); 
for (int 1 = 0; i < n; i++) 
StdOut.print1inChits[i]); 
4 


} 
这 个 类 封装 了 一 个 简单 的 整数 计数 器 ， 为 其 分 配 一 个 字符 品名 称 。 并 将 


其 初始 化 为 0( Java 的 默认 初始 化 ) 。 当 客户 端 代码 调用 increment() 时 递增 ， 
当 客户 端 调 用 value() 时 返回 计数 值 ， 当 调用 toString() 时 返回 包含 其 名 称 和 值 
审 










java Counter 6 600000 
: 100684 


% 
0 
六 
2: 100119 
3 
4 
5 


: 100037 


代码 清晰 度 。 精 确 地 设计 数据 类 型 ， 可 以 使 客户 代码 更 清晰 地 表达 计算 过 程 ， 从 而 提 
高 程序 设计 的 质量 。 在 3.1 节 和 3.2 节 中 ,我 们 已 经 看 到 了 很 多 客户 代码 的 例子 ， 在 讨论 
Histogram (程序 3.2.3 ) 时 就 提 到 过 这 个 问题 。 有 精确 数据 类 型 的 客户 程序 比 没有 的 更 加 清 
晰 ， 因 为 实例 方法 addDataPoint() 的 调用 可 以 清楚 地 标识 客户 程序 中 的 设计 重点 。 可 以 观察 
到 ， 良 好 的 设计 的 一 个 关键 之 处 在 于 ， 基 于 合理 设计 的 抽象 接口 编写 的 代码 几乎 就 可 以 当成 
文档 。 一 些 面 向 对 象 程序 设计 爱好 者 可 能 会 争辩 : 如 果 Histogram 使 用 Counter 会 更 容易 理 
解 (参见 练习 3.3.3 ), 但 这 一 点 是 存在 争议 的 。 

我 们 在 本 书 中 一 直 强 调 封装 的 优点 。 在 设计 数据 类 型 的 情景 下 ， 我 们 再 次 进行 总 结 。 封 
装 可 以 实现 模块 化 程序 设计 ， 人 允许 我 们 : 
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。 独立 开发 客户 程序 和 实现 代码 。 

。 使 用 改进 的 实现 版 本 而 不 会 影响 客户 程序 。 

。 在 尚未 完成 的 程序 上 继续 开发 新 程序 (任何 客户 程序 都 可 以 基于 API 编写 代码 )。 
封装 还 可 以 实现 数据 类 型 的 操作 隔离 ， 这 将 : 

。 在 实现 代码 中 添加 一 致 性 检查 和 其 他 调试 工具 。 

。 使 客户 代码 更 加 清晰 。 

一 个 正确 实现 的 (被 封装 的 ) 数据 类 型 扩展 了 Java 语言， 使 得 任何 客户 程序 都 可 以 使 


用 它 。 


不 变性 ”正如 3.1 节 末 尾 所 定义 的 ， 如 果 一 个 数据 类 型 的 值 一 旦 创建 就 不 可 更 改 ， 则 该 
数据 类 型 的 对 象 是 不 可 变 的 。 不 可 变 的 数据 类 型 是 指 该 类 型 的 所 有 对 象 均 不 可 变 。 作 为 对 
比 ， 可 变数 据 类 型 指 该 类 型 对 象 的 值 被 设计 成 可 变 的 。 在 本 章 讨论 的 数据 类 型 中 ，String、 
Charge、Color 和 Complex 都 是 不 可 变 的 ， 而 Turtle、Picture、Histogram、StockAccount 和 
Counter 都 是 可 变 的 。 是 否 使 数据 类 型 不 可 变 是 一 个 基本 的 设计 决策 ， 取 决 于 所 开发 的 应 用 
程序 。 

不 可 变 类 型 。 许 多 数据 类 型 的 目的 是 封装 不 会 更 改 的 数据 ， 以 便 数据 的 行为 与 基本 类 型 
相同 。 例 如 ，Complex 客户 程序 的 程序 员 很 可 能 期 望 编写 代 
码 z=z0， 这 是 一 个 合理 的 期 望 ， 就 像 使 用 double 或 者 int 变 可 变 的 
量 那样 使 用 两 个 Complex 变量 。 但 是 如 果 Complex 对 象 是 String Turtle 
可 变 的 ， 并 且 z 在 执行 赋值 语句 z=z0 后 改变 了 ,那么 z0 的 Charge Picture 
值 也 会 改变 (因为 它们 都 是 对 同一 个 对 象 的 引用 ) ! 这 个 出 Color Histogram 
乎 意料 的 结果 被 称 为 别名 错误 ， 对 于 许多 面向 对 象 程序 设 Comp1ex StockAccount 
计 的 新 手 而 言 是 一 个 意外 。 实 现 不 可 变 类 型 的 一 个 主要 原 Vector Counter 
因 是 我 们 可 以 在 赋值 语句 中 使 用 不 可 变 对 象 (或 者 作为 参数 Java 数组 
和 函数 返回 值 )， 而 无 须 担心 它们 的 值 发 生变 化 。 

可 变 类 型 。 对 于 许多 数据 类 型 来 说 ， 抽 象 的 目的 是 封装 可 更 改 的 数据 。Turtle (程序 
3.2.4 ) 就 是 一 个 很 好 的 例子 。 我 们 使 用 Turtle 是 为 了 减轻 客户 程序 跟踪 变化 值 的 压力 。 同 
样 ， 对 于 Picture、Histogram、StockAccount、Counter 和 Java 数组 等 类 型 ， 我们 期 望 这 些 
数据 类 型 的 值 可 以 改变 。 当 我 们 将 一 个 Turtle 作为 一 个 参数 传递 给 一 个 方法 时 ， 如 Koch,， 
我 们 期 望 Turtle 对 象 的 值 可 以 发 生变 化 。 

数组 和 字符 串 。 在 使 用 Java 数组 (可 变 ) 和 Java 字符 串 数据 类 型 (不 可 变 ) 时 ， 作 为 客 
户 程序 的 程序 员 ， 你 已 经 了 解 了 它们 的 区 别 。 当 你 将 一 个 String 传递 给 一 个 方法 时 ， 你 不 必 
担心 这 个 方法 改变 String 中 的 字符 序列 ， 但 是 当 你 将 一 个 数组 传递 给 一 个 方法 时 ， 这 个 方法 
可 以 随意 地 更 改 数组 元 素 的 值 。String 数据 类 型 是 不 可 变 的 ， 因 为 我 们 通常 不 希望 字符 串 值 
可 变 ; Java 数组 是 可 变 的 ， 因 为 我 们 通常 希望 数组 值 是 可 变 的 。 在 其 他 一 些 情况 下 ， 我 们 可 
能 想 要 可 变 的 字符 串 ( 这 是 Java 的 StringBuilder 数据 类 型 的 目的 ) 以 及 不 可 变 的 数组 (这 是 
我 们 将 在 本 节 后 面 研 究 的 Vector 数据 类 型 的 目的 )。 

不 可 变 的 优点 5 一 般 来 说 ， 不 可 变数 据 类 型 更 容易 使 用 且 一 般 不 会 误 用 ， 因 为 可 改变 对 
象 值 的 代码 范围 远 远 小 于 可 变 类 型 。 使 用 不 可 变数 据 类 型 的 代码 更 容易 调试 ， 因 为 更 容易 在 
使 用 它们 的 客户 代码 中 保证 对 象 状 态 的 一 致 性 。 当 使 用 可 变数 据 类 型 时 ， 必 须 始 终 注意 对 象 
更 改 的 时 间 和 位 置 。 
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不 可 变 的 代价 。 不 可 变 对 象 的 不 足 之 处 在 于 必须 为 每 一 个 值 创建 一 个 新 的 对 象 。 例 如 ， 
表达 式 z=z.times(z).plus(z0) 会 创建 一 个 新 的 对 象 (z.times(z) 的 ”complex z0; 
返回 值 )， 然 后 使 用 该 对 象 来 调用 plus0， 但 无 须 保 存 该 对 象 的 ET 2 "20 1 
引用 。 诸 如 Mandelbrot (程序 3:2.7) 这 样 的 程序 ， 创建 了 大 量 ”= ?times(z).plus(z0); 
类 似 的 中 间 对 象 。 然 而 ， 这 个 开销 通常 是 可 控 的 ， 因 为 Java 垃 
圾 收集 器 通常 优化 这 种 情况 。 而 且 ， 如 同 Mandelbrot 一 样 ， 当 
计算 的 关键 是 产生 大 量 的 中 间 值 时 ， 我 们 愿意 承担 此 类 开销 。 
Mandelbrot 还 创建 了 大 量 (不 可 变 的 ) Color 对 象 。 

final。 我 们 可 以 使 用 final 修饰 符 支 持 数据 类 型 的 强制 不 变 
性 。 当 将 一 个 实例 变量 声明 为 final 的 时 候 ， 变 量 只 能 被 赋值 一 
次 ， 无 论 是 在 内 联 初 始 化 语句 中 还 是 在 构造 函数 中 。 任 何其 他 可 
能 尝试 修改 final 变量 值 的 代码 都 会 导致 编译 错误 。 在 我 们 的 代码 
中 ,使 用 final 修饰 符 的 实例 变量 的 值 永远 不 会 改变 。 这 一 策略 作 
为 不 变 值 的 保护 ， 可 以 防止 误 更 改 ， 并 使 程序 更 容易 调试 。 例 如 ， 
我 们 不 必 在 追踪 中 包含 final 变量 ， 因 为 它 的 值 永 远 不 会 改变 。 

引用 类 型 。 遗 憾 的 是 ， 只 有 当 实 例 变 量 是 基本 类 型 而 不 是 引 
用 类 型 时 ，final 才能 保证 其 不 变性 。 如 果 引 用 类 型 的 实例 变量 具有 
final 修饰 符 ， 那么 该 实例 变量 (对 象 引用 ) 的 值 永 远 不 会 改变 
变量 将 始终 引用 同一 个 对 象 。 但 是 ， 对 象 本 身 的 值 是 可 以 改变 的 。 
例如 ， 如 果 有 一 个 数组 实例 变量 声明 为 fnal， 我 们 是 不 能 改变 数 
组 的 ( 即 改变 其 长 度 或 类 型 )， 但 可 以 改变 数组 中 单个 元 素 的 值 。 -人 全 全 开拓 
因此 ， 可 能 会 出 现 别名 错误 。 例 如 ， 以 下 代码 并 没有 实现 一 个 不 可 变 的 数据 类 型 : 


public class Vector 
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private final double[] coords; 
public Vector(double[] a) 
二 


coords = ai 


= 


客户 程序 可 以 创建 一 个 Vector 对 象 ， 指 定数 组 中 的 元 素 ， 并 在 创建 Vector 之 后 修改 其 
元 素 〈 绕 过 API): 

double[] a = { 3.0, 4.0 }; 

Vector vector = new Vector(a); 

a[0] = 17.0;  ”// coords[0] 现 在 是 17.0 

实例 变量 coords[] 标记 为 private 和 final 类 型 ， 但 Vector 是 可 变 的 ， 因 为 实现 代码 中 的 引用 
指向 与 客户 端 相同 的 数组 。 如 果 客 户 代码 改变 了 数组 中 的 一 个 元 素 ， 那么 这 个 改变 也 相应 地 出 现 
在 coords[] 数组 中 ， 因 为 coords] 和 a 是 别名 。 为 了 确保 包含 可 变 类 型 实例 变量 的 数据 类 型 的 不 
可 变性 ,我 们 需要 创建 一 个 本 地 拷贝 ， 称 为 防御 拷贝 。 接 下 来 ,我 们 研究 这 个 拷贝 的 实现 。 

在 任何 数据 类 型 的 设计 中 都 需要 考虑 不 可 变性 问题 。 在 理想 情况 下 ， 应 该 在 一 个 数据 类 
型 的 API 中 指定 其 是 否 可 变 ， 以 便 客户 程序 知道 对 象 值 不 可 更 改 。 实 现 一 个 不 可 变 的 数据 
类 型 可 能 是 一 种 负担 。 对 于 复杂 的 数据 类 型 ， 创 建 防御 拷贝 是 一 个 挑战 ， 确 保 没有 任何 实例 
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方法 修改 对 象 值 是 另 一 个 挑战 。 


实例 : 空间 向 量 ， 为 了 在 实用 的 数学 抽象 情境 中 盖 述 上 述 设 计 理 念 ， 我 们 将 讨论 一 种 向 
量 数据 类 型 。 与 复数 类 似 ， 向 量 抽象 的 基本 定义 众所周知 ， 因 为 它 已 经 在 应 用 数学 中 发 挥 了 
100 多 年 的 重要 作用 。 线 性 代数 就 是 主要 研究 向 量 性 质 的 数学 领域 。 线 性 代数 具有 广泛 应 用 
的 丰富 而 成 功 的 理论 ， 在 社会 科学 和 自然 科学 的 各 个 领域 都 占据 重要 的 地 位 。 全 面 讨论 线性 
代数 显然 超出 本 书 的 范围 ， 但 是 很 多 重要 的 应 用 是 基于 基本 和 熟知 的 计算 ， 所 以 向 量 和 线性 
代数 将 在 全 书 中 多 次 提 到 (例如 ，1.6 节 中 的 随机 冲浪 者 例子 就 是 基于 线性 代数 的 )。 因 此 ， 
有 必要 将 这 种 抽象 封装 为 数据 类 型 。 

空间 向 量 是 一 个 具有 大 小 和 方向 的 抽象 实体 。 空 间 向 量 提供 了 
一 个 自然 方法 来 描述 物理 世界 属性 ， 如 力 、 速 度 、 动 量 和 加 速度 。 
指定 一 个 向 量 的 一 种 标准 方法 是 在 直角 坐标 系 中 从 原点 指向 一 个 点 
的 箭头 : 向 量 方向 是 从 原点 到 点 的 射线 方向 ， 向 量 大 小 是 箭头 的 长 
度 (从 原点 到 点 的 距离 )。 要 指定 一 个 向 量 ， 只 需 指 定 一 个 点 即 可 。 

上 述 概念 可 以 扩展 到 任何 维 数 的 向 量 空间 : 一 个 个 实数 的 有 “i 
序列 表 (一 个 n 维 空间 点 的 坐标 ) 能 够 指定 一 个 n 维 空 间 中 的 向 量 。 按 照 惯例 ， 我 们 使 用 粗 斜 
体 来 表示 向 量 ， 在 括号 内 用 逗号 分 隔 的 数值 或 者 带 索引 的 变量 名 称 〈 和 斜体 ， 相 同 的 字母 ， 有 
索引 下 标 ) 表示 向 量 值 。 例 如 ， 我 们 可 以 用 x 来 表示 向 量 (xu x2,…, xw-1 )， 使 用 7 来 表示 向 量 
(y1, 83, ***, yn-1 )o 

API。 向 量 的 基本 运算 包括 两 个 向 量 的 加 法 、 一 个 向 量 乘 以 一 个 标量 、 计 算 两 个 向 量 的 
点 积 、 计 算 向 量 的 大 小 和 方向 ， 其 定义 如 下 : 

e 加 法 : x+y=(xotyo, X1ty1, ,Xn-1++yn-1) 

。 标量 乘积 : ax=(Qxo, 0x1,*…, 0xn-1) 

e 点 积 : xX， y=Xo JJ0HXI yit +X Yn-l 

e 大 小 : |x|=(x6+x?+…+x21)'? 

e 方向 : x/|x|=(xo/|x|,xi/|x|,** ,Xn i/ |X|) 

向 量 加 法 、 标 量 乘积 和 方向 的 结果 是 向 量 ,但 大 小 和 点 积 的 结果 是 标量 (实数 )。 例 如 ， 
假设 有 x=(0, 3, 4,; 0); y=(0, -3,，1， -4)， 则 x+ty=(0, 0,，5，-4)，3x=(0,9，12,，0)， 
XxX， y=-5，|x|=5，x/|x|=(0,3/5,4/5,0)。 方 向 向 量 是 一 个 单位 向 量 : 其 大 小 为 1。 这 些 定义 对 应 
的 API 如 下 : 






回 量 方 回 
TS 


”向量 天 未 


public class Vector 


Vector(Cdouble[] a) 用 给 定 的 笛 卡 儿 坐 标 创建 一 个 向 量 
Vector plus(Vector that) 该 向 量 和 that 的 和 
Vector minus(Vector that) 该 向 量 和 that 的 差 
Vector scale(double alpha) 该 向 量 与 alpha 的 乘积 
double dot(Vector that) 该 向 量 和 that 的 点 积 
double magnitude() 问 量 的 模 
Vector direction() 与 该 向 量 相同 方向 的 单位 向 量 
double cartesian(int i) 第 i 个 笛 卡 儿 坐标 
String toString() 字符 串 表 示 


空间 向 量 的 API (参见 程序 3.3.3 ) 
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就 像 Complex 的 API 一 样 ， 这 个 API 没有 明确 指定 数据 类 型 为 不 可 变 对 象 ， 但 是 我 们 
了 解 客户 程序 员 (他 们 可 能 在 数学 抽象 层面 上 思考 ) 肯定 希望 对 象 不 可 变 。 
表示 。 依 照 惯例 ， 我 们 开发 实现 的 首选 任务 是 选择 一 个 数据 的 表示 方式 。 在 构造 函数 中 
使 用 数组 保存 直角 坐标 系 各 坐标 值 是 一 个 明智 的 选择 ,但 这 不 是 唯一 合理 的 选择 。 实 际 上 ， 
线性 代数 的 基本 原理 之 一 是 ， 满 足 特定 条 件 的 一 组 n 个 向 量 就 可 以 用 作 坐 标 系 统 的 基础 ( 即 
坐标 轴 ) : 任何 一 个 向 量 可 以 表示 为 一 组 n 个 向 量 的 线性 组 合 ， 这 nn 个 向 量 满足 线性 无 关 的 
特定 条 件 。 这 种 改变 坐标 系统 的 能 力 非 常 适合 封装 。 大 多 数 客户 程序 无 须知 道内 部 的 具体 表 
示 ， 只 需 处 理 Vector 对 象 和 操作 即 可 。 如 果 可 以 保证 ， 那 么 实现 可 以 更 换 坐 标 系 而 不 影响 
任何 客户 代码 。 


程序 3.3.3 ”空间 向 量 
a class Vector 


private final double[] coords; coords[] | 稍 卡 儿 华 标 


public Vector(double[] a) 
{ /做 二 个 防御 拷贝 以 确保 对 象 不 可 交 
coords = new double[a.length]; 
for (int i = 0; 1 < a.length; i++) 
coords[i] = a[i]; 


public Vector plus(Vector that) 
{ /该 向 量 和 that 的 和 
double[] result = new double[coords.length]; 
for (int i = 0; i < coords.length; i++) 
result[i] = this.coords[i] + that.coords[i]; 
return new Vector(result); 


public Vector scale(double alpha) 
{ Ce 
double[] result = new double[coords.length]; 
for (int 1 = 0; 1 < coords.length; i++) 
result[i] = alpha * coords[i]; 
return new Vector(result); 


public double dot(Vector that) 
{i WW 该 向 量 和 that 的 小 积 
double sum = 0.0; 
for (int i1 = 0; i < coords.length; i++) 
sum += this.coords[i] * that.coords[i]; 
return sum; 


publie double magnitude() 
{ return Math.sqrt(this.dot(this)); } 


public Vector directionO 
{ return this.scale(1l/this.magnitude()); } 


public double cartesian(int i) 
{ return coords[i]; 





该 实现 将 数学 空间 向 量 抽象 封装 在 不 可 变 的 Java 数 据 类 型 中 。Sketch ( 程 
序 3.3.4 ) 和 Body ( 程序 3.4.1 ) 是 其 典型 的 客户 程序 ， 实 例 方法 minusO0 和 
toString() 留 作 练习 ( 练习 3.3.4 和 练习 3.3.14 ) ， 测 试 客户 程序 是 练习 3.3.5。 
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实现 。 给 定数 据 表示 方法 ， 实 现 这 些 操作 的 代码 (程序 3.3.3 中 的 Vector) 并 不 是 一 个 
困难 的 任务 。 构 造 函 数 创建 了 一 个 客户 数组 的 防御 拷贝 ， 且 没有 任何 方法 可 以 给 该 拷贝 赋 
值 ， 因 此 Vector 对 象 是 不 可 变 对 象 。cartesian() 方法 对 于 直角 坐标 表示 十 分 容易 : 只 需 返 回 
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数组 中 第 i 个 坐标 即 可 。 它 实际 上 实现 了 适用 于 任何 Vector 表示 的 数学 函数 : 几何 投影 到 第 
i 个 笛 卡 儿 轴 。 

this 引用 。 在 实例 方法 (或 构造 函数 ) 中 ，this 关键 字 | 
为 我 们 提供 了 一 种 方法 ， 用 来 引用 调用 实例 方法 (或 构造 函 ; | - > 
数 ) 的 对 象 。 我 们 可 以 像 使 用 任何 其 他 对 和 象 引 用 一 样 (例如 ， a 
调用 一 个 方法 、 作 为 参数 传递 给 方法 或 访问 实例 变量 ) 来 使 | 下 
用 this。 例 如 ，Vector 中 的 magnitude0 方法 使 用 this 关 键 川 RT 
字 的 方式 有 两 种 : 调用 dot() 方法 和 作为 dot() 方 法 的 参数 。 J 全 汐 
因 此， 表达 式 vector.magnitude() 等 价 于 Math.sqrt(vector. 
dot(vector))。 一 些 Java 程 序 员 总 是 使 用 this 来 访问 实例 变 
量 。 这 个 策略 使 得 代码 很 容易 维护 ， 因 为 它 清楚 地 指明 我 们 引用 实例 变量 (而 不 是 局 部 变量 
或 参数 变量 ) 的 时 机 。 然 而 ， 这 导致 了 this 关键 字 的 滥用 ， 所 以 我 们 采取 相反 的 策略 ， 在 代 
码 中 谨慎 地 使 用 this。 

当 所 有 操作 都 能 如 此 容易 通过 数组 实现 时 ,为 什么 要 使 用 Vector 数据 类 型 呢 ? 现在 ， 
这 个 问题 的 答案 是 显而易见 的 : 启用 模块 化 编程 ， 不 仅 便于 调试 ， 而 且 可 以 使 代码 更 清晰 。 
double 型 数组 是 一 种 低级 的 Java 机 制 ， 允 许 对 其 元 素 进行 各 种 操作 。 通 过 将 我 们 的 操作 限 
制 在 Vector 的 API 中 (对 于 许多 客户 程序 ， 这 也 是 我 们 唯一 需要 的 )， 可 以 简化 设计 、 实 现 
和 维护 客户 程序 的 过 程 。 由 于 Vector 数据 类 型 是 不 可 变 的 ， 我 们 可 以 像 使 用 基本 数据 类 型 
一 样 使 用 它 。 例 如 ， 当 将 一 个 Vector 对 象 传递 给 一 个 方法 时 ， 可 以 确信 该 对 象 的 值 不 会 改 
变 (但 在 传递 一 个 数组 时 并 不 能 保证 这 一 点 )。 使 用 Vector 数据 类 型 及 其 相关 操作 编写 程序 
是 一 种 简单 而 自然 的 方式 ， 可 以 围绕 此 抽象 概念 开发 大 量 数学 知识 相关 的 程序 。 

Java 语言 支持 定义 对 象 之 间 的 关系 ， 这 种 关系 的 定义 方式 称 为 继承 。 软 件 开发 人 员 广 
泛 使 用 这 些 机 制 ， 因 此 ， 如 果 读 者 也 学 习 软 件 工程 课程 ， 将 会 详细 研究 这 些 机 制 。 通 常 ， 
这 些 机 制 的 实际 使 用 超出 了 本 书 的 知识 范围 ， 但 我 们 将 简要 描述 Java 中 的 两 种 主要 继承 形 
式 一 一 接口 继承 和 实现 继承 ， 在 后 面 的 几 个 例子 中 ， 我 们 可 能 会 遇 到 它们 。 

接口 继承 ( 子 类 型 化 ) Java 提供 了 interface (接口 ) 结构 ， 用 于 指定 若干 个 类 必须 实现 
的 一 组 通用 方法 ， 这 些 类 之 间 可 能 本 来 毫 无 关联 s :也 就 是 说 ，interface 类 描述 的 是 一 组 方法 
的 协议 。 我 们 把 这 种 协议 称 为 接口 继承 ， 因 为 实现 类 从 接口 类 继承 了 部 分 API。 通 过 调用 接 
口中 的 通用 方法 ， 我 们 能 够 编写 可 以 操作 不 同类 型 的 对 象 的 客户 程序 。 与 大 多 数 新 的 编程 概 
念 一 样 ， 刚 开始 有 些 混乱 ,但 是 在 看 过 一 些 例子 之 后 就 会 觉得 容易 理解 了 。 

定义 一 个 接口 。 作 为 一 个 启发 性 的 例子 ,假设 我 们 要 编写 代码 来 绘制 任何 实 值 函 数 。 我 
们 以 前 遇 到 过 这 样 一 个 程序 ， 即 通过 对 函数 在 一 个 特定 区 间 内 用 均匀 间隔 点 进行 采样 来 绘制 
一 个 特定 函数 。 为 了 将 这 些 程序 扩展 以 处 理 任 意 函 数 ， 我 们 为 单一 变量 的 实 值 函数 定义 一 个 
Java 接口 : 





投影 一 个 向 量 ( 3D ) 


public interface Function 


public abstract double evaluate(double x); 


接口 声明 的 第 一 行 类 似 于 类 声明 ， 但 是 使 用 关键 字 interface 而 不 是 关键 字 class。 接 口 
的 主体 包含 一 个 抽象 方法 的 列表 。 抽 象 方法 是 声明 的 方法 ， 但 不 包含 任何 实现 代码 ; 它 只 包 
含 方法 签名 ， 以 分 号 结尾 。abstract 修饰 符 将 方法 指定 为 抽象 的 。 与 Java 类 一 样 ， 我 们 必须 
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将 Java 接口 保存 在 名 称 与 接口 名 称 匹配 的 文件 中 ， 并 以 .java 作为 扩展 名 。 446 
实现 一 个 接口 。 接 口 是 一 个 类 实现 一 组 方法 的 协议 。 若 要 编写 实现 接口 的 类 ， 必 须 执行 

两 项 操作 。 首 先 ， 必 须 在 类 声明 中 包含 接口 名 称 的 implements 子 句 。 我 们 可 以 将 其 视 为 签 

署 协议 ， 承 诺 要 实现 接口 中 声明 的 每 个 抽象 方法 。 其 次 ， 每 个 抽象 方法 都 必须 实现 。 例 如 ， 

可 以 定义 一 个 类 ， 用 于 计算 实数 的 平方 ， 如 下 所 示 ， 这 个 类 实现 Function 接口 : 


public class Square implements Function 


public double evaluate(double x) 
Teturn x 


} 
同样 ， 可 以 定义 一 个 计算 高 斯 概率 密度 函数 的 类 ( 见 程 序 2.1.2 ): 


public class GaussianPDF implements Function 


public double evaluate(double x) 

4， { return Math.exp(-x*x/2) / Math.sqrt(2 * Math.PI); } 

如 果 我 们 未 能 实现 接口 中 指定 的 任何 一 个 抽象 方法 ， 将 会 出 现 编译 时 错误 。 相反 ， 实 现 
接口 的 类 可 能 包括 未 在 接口 中 指定 的 方法 s 

使 用 一 个 接口 。 接 口 是 引 用 类 型 。 我们 可 以 像 使 用 任何 其 他 数据 类 型 名 称 一 样 使 用 
接口 名 称 。 例 如 ， 可 以 将 变量 的 类 型 声明 为 接口 的 名 称 。 这 样 做 时 ， 分 配给 该 变量 的 任何 
对 象 都 必须 是 实现 这 个 接口 的 类 的 实例 。 例 如 ，Function 类 型 的 变量 可 以 存储 Square 或 
GaussianPDF 类 型 的 对 象 ， 但 不 能 存储 Complex 类 型 的 对 象 5 


Function fl = new Square() ; 

Function f2 = new GaussianPDFO; 

Function f3 = new Comp1lex(1.0，2.0); // 编译 时 错误 

即使 实现 类 定义 了 其 他 方法 ， 接 口 类 型 的 变量 也 只 能 调用 在 接口 中 声明 的 方法 。 447 

当 接 口 类 型 的 变量 调用 接口 中 声明 的 方法 时 ，Java 知道 程序 在 调用 哪个 方法 ， 因 为 调 
用 对 象 的 类 型 是 明确 的 。 例 如 ，f1.evaluate() 将 调用 Square 类 中 定义 的 evaluate() 方法 ， 而 
f2.evaluate() 将 调用 GaussianPDF 类 中 定义 的 evaluate( 方法 。 这 个 强大 的 编程 机 制 被 称 为 
多 态 (polymorphism) 或 动态 分 派 (dynamic dispatch ) 。 

为 了 体会 使 用 接 日 和 多 态 的 好 处 ， 我 们 回 到 在 区 间 [a，b] 中 绘制 函数 的 图 像 的 应 用 。 
如 果 函 数 了 足够 平滑 ， 我 们 可 以 在 区 间 [a，b] 的 n+1 个 均匀 间隔 的 点 上 对 函数 进行 采样 ， 并 
使 用 StdStats.plotPoints() 或 StdStats.plotLines() 显示 结果 。 


public static void plot(Function f, double a, double b, int n) 


double[] y = new double[n+1]; 
double delta = (b - a) / ni 
for (Cint i1 = 0; i <= Nn; i++) 

y[i] = f.evaluate(a + delta*i); 
StdStats.plotPoints(y); 
StdStats.plotLines(y); 


使 用 接口 类 型 Function 声明 变量 f 的 好 处 是 ， 对 于 实现 Function 接口 的 任何 数据 类 型 
的 对 象 f， 包 括 Square 或 GaussianPDF， 都 使 用 相同 的 方法 调用 fevaluate()。 因 此 ， 我 们 不 
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需要 为 每 种 类 型 编写 重 载 方法 一 一 可 以 为 许多 类 型 复 用 相同 的 plot( 函数 ! 这 种 不 修改 客户 
代码 而 绘制 任何 函数 的 能 力 ， 是 接口 继承 的 一 个 有 说 服 力 的 例子 。 


Function fl = new WAL Function f2 = new pe 
plot(fl, -0.6, 0.6 plot(f2, -4.0, 4.0 
448 绘制 函数 图 


用 函数 计算 。 有 时 ,特别 是 在 科学 计算 中 ， 经 常 需要 对 函数 进行 计算 : 我 们 需要 处 理 微 
分 函数 、 整 数 函 数 、 求 函数 的 根 等 。 在 某 些 编程 语言 (被 称 为 函数 式 编程 语言 ) 中 ， 这 个 需 
求 与 语言 的 底层 设计 是 一 致 的 ， 其 使 用 函数 计算 来 大 大 简化 客户 代码 。 遗 憾 的 是 ， 函 数 不 是 
Java 中 最 重要 的 对 象 。 但 是 ， 正 如 刚才 的 例子 plotO 一 样 ， 我 们 可 以 使 用 Java 接口 来 实现 
一 些 相 同 的 目标 。 

例如 ， 研 究 在 区 间 (<a，2) 中 的 正 实 数 函 数 .六 曲线 下 区 域 ) 的 黎 曼 积分 的 估计 问题 。 这 个 
计算 被 称 为 正 交 (quadrature) 或 数值 积分 (numerical 
integration)。 已 经 有 一 些 方法 可 用 来 求 积分 。 在 这 些 
方法 中 ， 最 简单 的 也 许 就 是 矩形 规则 ,我们 通过 计算 
曲线 下 元 个 等 宽 矩 形 的 总 面积 来 近似 求 得 积分 值 。 下 
面 定 义 的 integrate() 函数 使 用 矩形 规则 将 区 间 划 分 为 
1 个 矩形 ， 用 以 计算 区 间 (ae，25) 中 实 值 函 数 的 积分 : 


public static double integrate(Function f, 
double a, double b, int n) 





{ 
double delta = (b - a) / ni 
double sum = 0.0; 
forzGint i-alO IY < nilstt) 
sum += delta * f.evaluate(a + delta * (i + 0.5)); 
return sum; 


} 


?的 不 定 积分 是 x/3， 所 以 区 间 0 一 10 的 定 积分 是 1000/3。 调 用 integrate(new Square(),0,10， 
1000) 将 返回 333.33324999999996， 如 果 我 们 只 处 理 结 果 的 六 位 有 效 数 字 ， 这 就 是 正确 答 
案 。 类 似 地 ， 调 用 integrate(new GaussianPDF(),-1,1,1000) 返回 0.6826895727940137， 这 是 
只 处 理 七 位 有 效 数 字 时 的 正确 答案 (如 果 需 要 ， 可 以 回顾 高 斯 概率 密度 函数 和 程序 2.1.2 )。 

正 交 法 并 不 总 是 计算 函数 值 的 最 有 效 或 最 精确 的 方法 。 例 如 ， 程 序 2.1.2 中 的 Gaussian. 
cdf() 函数 是 实现 高 斯 概率 密度 函数 的 一 种 更 快 、 更 精确 的 方法 。 然 而 ， 这 个 方法 的 优点 是 

对 任何 函数 都 可 以 使 用 ， 只 是 需要 一 定 的 技术 条 件 以 保证 曲线 足够 光滑 。 

Lambda 表达 式 。 我 们 刚刚 研究 的 用 于 计算 函数 的 语法 有 些 笨拙 。 例 如 ， 为 了 实现 绘 
制 或 积分 ， 为 每 个 函数 定义 一 个 新 类 ， 用 于 实现 Function 接口 ， 这 是 一 件 很 烦琐 的 事 。 在 
这 种 情况 下 ， 为 了 简化 语法 ，Java 提供 了 一 个 强大 的 函数 编程 功能 ， 称 为 Lambda 表达 式 。 
我 们 应 该 将 Lambda 表达 式 看 作 一 段 可 以 在 以 后 传递 和 执行 的 代码 。 在 最 简单 的 形式 中 ， 
Lambda 表达 式 由 三 个 元 素 组 成 : 
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。 人 参数 变量 列表 〈 用 逗号 分 隔 ,， 并 用 圆 括号 括 起 来 )。 
e。 Lambda 运算 符 ->。 
。 一 个 单独 的 表达 式 ， 它 是 Lambda 表达 式 返 回 的 值 。 i A 
例如 ，Lambda 表达 式 (x, y)->Math.sqrt(x * x+y * y) 
实现 了 求 直 角 三 角形 剑 边 的 函数 。 当 只 有 一 个 参数 时 ， 括 ”下 | esateow + yey 
号 是 可 选 的 ， 所 以 Lambda 表达 式 x ->x * x 实现 平方 也 Lambda 运 算 符 
数 ，x ->Gaussian.pdf(x) 实现 高 斯 概率 密度 函数 。 Lambda 表达 式 分 析 
Lambda 表达 式 的 主要 功能 是 以 简洁 的 方式 来 实现 函数 接口 (具有 单个 抽象 方法 的 接 
人 口 )。 具 体 而 言 ， 可 以 在 需要 函数 接口 对 象 的 任何 地 方 使 用 
表达 式 Lambda 表达 式 。 例 如 ， 可 以 通过 调用 integrate(x ->x * 
人 人 x,0,10,1000)， 从 而 绕 过 定义 Square 类 的 需求 。 我 们 不 需要 
明确 声明 Lambda 表达 式 实现 了 Function 接口 ， 只 需要 单 
个 抽象 方法 的 签名 与 Lambda 表达 式 (相同 数量 的 参数 和 类 








new GaussianPDFO) 
X -= XEX 


x -> Gaussian.pdf(x) 


x -> Math.cos(x) 型 ) 兼容 ， Java 就 会 在 上 下 文 中 推断 出 这 个 表达 式 。 在 这 
实现 Function 接口 的 典型 表达 式 ”种 情况 下 ,Lambda 表达 式 x ->x * x 与 抽象 方法 evaluate() 
兼容 。 


内 置 接口 。 我 们 将 在 本 书后 面 研 究 Java 内 置 的 三 个 接口 。 在 4.2 节 中 ,我们 将 研究 
Java 的 java.util.Comparable 接口 ， 其 包含 一 个 抽象 方法 compareTo()。compareTo() 方法 通 
过 比较 相同 类 型 的 对 象 来 定义 一 个 自然 顺序 ， 如 字符 串 的 字母 顺序 以 及 整数 和 实数 的 升序 ， 
这 使 得 我 们 能 够 编写 代码 对 对 象 数组 进行 排序 。 在 4.3 节 中 ,我 们 将 使 用 接口 来 使 客户 程序 
能 够 循环 访问 集合 中 的 项 ， 而 不 依赖 于 底层 表示 形式 。Java 为 此 提供 了 两 个 接口 : java.util. 
Iterator 和 java.lang.Iterable。 

基于 事件 的 编程 。 接 口 继承 值 的 另 一 个 强大 示例 是 它 在 基于 事件 的 编程 中 的 使 用 。 例 
如 ， 考 虑 扩展 Draw 来 响应 用 户 输入 的 问题 ， 如 响应 用 户 点 击 鼠 标 或 敲 击 键盘 。 一 种 方法 是 
定义 一 个 接口 来 指定 在 用 户 输入 发 生 时 ，Draw 应 该 调用 哪个 或 哪些 方法 。 描 述 性 术语 回调 
用 来 描述 一 种 基于 接口 的 调用 ， 这 种 调用 从 一 个 类 中 的 方法 到 另 一 个 类 中 的 方法 。 你 可 以 在 
本 书 官网 上 找到 一 个 示例 接口 DrawListener， 以 及 如 何 编写 代码 以 响应 用 户 在 Draw 中 的 鼠 
标点 击 和 键盘 敲 击 。 我 们 可 以 发 现实 现 以 下 目标 很 容易 : 创建 一 个 Draw 对 象 ， 并 为 其 添加 
一 个 回调 方法 ， 当 用 户 输入 事件 (点击 鼠标 或 敲 击 键 盘 ) 发 生 时 ， 将 调用 这 一 回调 方法 ， 并 
将 用 户 键 入 的 字符 或 鼠标 单 击 的 位 置 传递 给 方法 。 编 写 交 互 式 代码 很 有 趣 ， 但 很 有 挑战 性 ， 
因为 你 必须 考虑 到 所 有 可 能 的 用 户 输入 操作 。 

接口 继承 是 一 种 高 级 编程 概念 ， 被 许多 经 验 丰 富 的 程序 员 所 接受 ， 因 为 它 能 够 在 不 
牺牲 封装 的 情况 下 复 用 代码 。 接 口 继承 支持 的 函数 式 编程 风格 在 某 些 方面 具有 争议 ， 但 是 
Lambda 表达 式 和 类 似 的 结构 可 以 追溯 到 早期 编程 ， 并 且 许 多 现代 编程 语言 也 有 这 种 方式 。 
这 种 风格 的 支持 者 坚信 我 们 应 该 专门 使 用 和 讲授 函数 式 编程 。 本 书 一 开始 没有 重视 这 种 编程 
风格 ， 因 为 我 们 所 遇 到 的 大 量 代 码 并 不 是 这 种 风格 的 。 我 们 在 这 里 介绍 这 种 方式 ， 是 因为 每 
个 程序 员 都 需要 了 解 这 种 方式 ， 并 在 合适 的 时 候 使 用 。 

实现 继承 ( 子 类 化 ) Java 还 支持 另 一 种 被 称 为 子 类 化 的 继承 机 制 。 其 目的 是 定义 一 个 
新 的 类 ( 称 为 子 类 或 派生 类 )， 从 男 一 个 类 ( 称 为 父 类 或 基 类 ) 继承 其 实例 变量 (状态) 和 实 
例 方法 (行为) 从 而 实现 代码 复 用 。 通 常 ， 子 类 重新 定义 或 重 写 父 类 中 的 某 些 方法 。 我 们 
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把 这 种 机 制 称 为 实现 继承 ， 因 为 这 时 一 个 类 继承 了 了 另 一 个 类 的 代码 。 

系统 程序 员 使 用 子 类 化 来 构建 所 谓 的 可 扩展 库 一 一 一 个 程序 员 (包括 读者 自己 ) 可 以 向 
男 一 个 程序 员 (或 者 可 能 是 一 个 系统 程序 员 团 队 ) 构建 的 库 中 添加 方法 ， 从 而 在 一 个 潜在 的 
巨大 的 库 中 有 效 地 复 用 代码 。 这 种 方法 被 广泛 使 用 ,特别 是 用 于 用 户 界面 的 开发 ， 以 便 复 用 
那些 为 用 户 提 供 实现 所 期 望 的 各 种 功能 (窗口 、 按 钮 、 滚动 条 、 下 拉 菜 单 、 剪 切 粘贴 、 访 问 
文件 等 ) 的 代码 。 


Object 


JApplet FileDialog 


GUI 组 件 的 子 类 继承 层次 结构 (部 分 ) 


在 系统 程序 员 之 间 ， 继 承 的 使 用 是 存在 争议 的 ， 因 对 其 是 否 优 于 子 类 型 ( subtyping， 即 
对 interface 的 继承 ) 是 有 争议 的 。 在 本 书 中 ， 我们 没有 使 用 继承 ， 因 为 在 两 个 方面 继承 是 与 
封装 对 立 的 。 首 先 ， 任 何 父 类 的 改变 都 会 影响 所 有 的 子 类 。 子 类 不 能 独立 于 父 类 开发 ， 实 际 
上 ， 子 类 完全 依赖 于 父 类 。 这 个 问题 被 称 为 脆弱 的 基 类 (fragile base class) 问题 。 其 次 ， 子 
类 代码 可 以 访问 父 类 中 的 实例 变量 ， 从 而 违背 父 类 代码 的 目标 。 例 如 ， 尽 管 像 Vector 这 样 
的 类 的 设计 者 可 能 非常 小 心地 确保 Vector 不 可 变 ， 但 是 一 个 能 够 完全 访问 这 些 实例 变量 的 
子 类 ， 却 可 以 毫 不 费力 地 修改 它们 。 

Java 的 Object 父 类 。 某 些 子 类 的 痕迹 已 经 被 内 置 到 Java 中 ， 因 此 继承 是 无 法 避免 的 。 
具体 而 言 ， 每 个 类 都 是 Java 的 Object 类 的 一 个 子 类 。 这 个 结构 能 够 实现 这 样 的 一 个 “ 约 
定 ”: 每 个 类 都 包含 toString()、equals()、hashCode() 和 其 他 几 个 方法 的 实现 。 每 个 类 都 从 
Object 继承 这 些 方法 。 在 使 用 Java 进行 编程 时 ， 经 常 需要 重 写 这 些 方法 中 的 一 个 或 多 个 。 


public class Object 


String toString() 这 个 对 象 的 字符 串 表示 形式 
boolean equals(Object x) 这 个 对 象 是 否 等 于 x? 
int hashCode() 这 个 对 象 的 散 列 码 
Class getClass() 这 个 对 象 的 类 


被 所 有 类 继承 的 方法 (本 书 中 用 到 的 ) 


面 房 允 复 编程 267 


字符 串 转 换 。 每 个 Java 类 都 会 继承 toString() 方法 ， 因 此 任何 一 个 客户 程序 都 可 以 调用 
任何 一 个 对 象 的 toString() 方法 。 与 Java 接口 一 样 ,，Java 知道 要 调用 哪个 toString() 方法 (多 
态 )， 因 为 Java 知道 调用 对 象 的 类 型 。 当 另 一 个 操作 数 是 字符 串 时 ， 这 个 约定 是 Java 自动 将 
字符 串 连接 运算 符 “+” 的 一 个 操作 数 转换 为 字符 串 类 型 的 基础 。 例 如 ， 如 果 x 是 任意 一 个 
对 象 的 引用 ， 则 Java 自动 将 表达 式 "x="+x 转换 为 "x="+x.toString()。 如 果 一 个 类 没有 重 写 
toString() 方法 ， 那 么 Java 会 调用 继承 的 toString() 来 实现 ,但 这 通常 是 没有 用 的 (通常 是 对 
象 内 存 地 址 的 字符 串 表示 形式 )。 因 此 ， 在 我 们 开发 的 每 个 类 中 重 写 toString() 方法 是 一 个 很 
好 的 编程 习惯 。 

等 式 。 两 个 对 象 相等 意味 着 什么 ?如果 使 用 x 和 y 作 为 对 象 Complex cl co 3; 3.0); 
来 测试 等 式 (x==y)， 我 们 测试 的 是 它们 是 否 具 有 相同 的 标识 对 号 汪 > Complex(1.0, 3.0); 
象 引 用 是 否 相同 。 例 如 ， 考 虑 右 图 中 的 代码 ， 该 代码 创建 了 由 三 
个 变量 cl1、c2 和 3 引用 的 两 个 Complex 对 象 (程序 3.2.6 )。 如 
图 所 示 , cl 和 c3 引 用 了 同一 个 对 象 ，c2 引用 的 对 象 与 它们 不 同 。 
因此 , (cl==c3 ) 为 true, 但 (cl==c2) 为 false。 这 被 称 为 引用 
相等 ， 但 一 般 情况 下 这 不 是 客户 想 要 的 功能 。 

一 般 客户 端 希 望 测试 数据 类 型 的 值 (对象 状态 ) 是 否 相 同 。 
这 被 称 为 对 象 相等 。Java 包含 equals() 方 法 (被 所 有 类 继承 ) 
例如 ，String 数据 类 型 以 自然 方式 重 写 此 方法 : 如 果 x 和 y 引 
用 String 对 象 ， 则 当 且 仅 当 两 个 字符 串 对 应 于 相同 的 字符 序列 ， 
x.equals(y) 才 为 true (而 不 是 取决 于 它们 是 否 引 用 相同 的 String 
对 象 )。 

Java 的 约定 是 ， 对 于 所 有 的 对 象 引 用 x、y 和 z，edquals() 方 
法 必须 通过 满足 以 下 三 个 自然 属性 实现 相等 关系 : 

。 自 反 性 : x.equals(x) 是 true。 

。 对 称 性 : 当 且 仅 当 yequals(x) 为 true，x.equals(y) 才 为 两 个 对 象 的 三 个 引用 

trueo。 

。 传递 性 : 如 果 x.equals(y) 为 true 日 yequals(z) 为 true， 则 x:equals(z) 为 true。 

另外 ， 以 下 两 个 属性 必须 保持 : 

。 对 x.equals(y) 的 多 次 调用 返回 相同 的 真 值 ， 前 提 是 两 个 调用 之 间 不 能 修改 对 象 。 

。x.equals(null) 返回 false。 

通常 ， 当 自 定义 数据 类 型 时 ， 需 要 重 写 equals() 方法 ， 因 为 继承 的 实现 是 引用 相等 。 例 
如 ， 当 且 仅 当 两 个 复数 对 象 的 实 部 和 虚 部 相等 ， 我 们 才 认 为 这 两 个 复数 相等 。 以 下 实现 可 以 
完成 这 项 工作 : 





public boolean equals(Object x) 


if (x == null) return false; 

if (this.getClass() != x.getClass()) return false; 

Complex that = (Complex) x; 

return (this.re == that.re) && (this.im == that.im); 
} 


这 个 代码 比 我 们 想象 的 复杂 ， 因 为 equals() 的 参数 可 以 是 任何 类 型 (或 null) 对 象 的 引 
用 ， 因 此 我 们 总 结 每 个 语句 的 作用 : 
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。 如 果 参 数 为 null， 则 第 一 个 语句 返回 false。 

。 如 果 两 个 对 象 的 类 型 不 同 ， 则 第 二 条 语句 使 用 继承 的 方法 getClass() 返回 false。 

。 第 二 条 语句 使 得 第 三 条 语句 中 的 类 型 转换 一 定 能 够 成 功 。 

。 最 后 一 条 语句 通过 比较 两 个 对 象 的 对 应 实例 变量 来 实现 相等 测试 的 逻辑 。 

我 们 可 以 使 用 这 个 实现 作为 模板 一 一 一 旦 实现 了 一 个 equals() 方 法， 读者 会 发 现实 现 男 
一 个 很 简单 。 

散 列 法 。 我 们 现在 讨论 一 个 与 相等 测试 相关 的 基本 操作 ， 称 为 散 列 ( hashing)， 用 于 
将 一 个 对 象 映射 为 一 个 整数 ( 称 为 散 列 码 )。 这 种 运算 非常 重要 ， 由 一 个 名 为 hashCode() 
的 方法 来 处 理 ， 这 个 方法 被 所 有 的 类 继承 。Java 的 约定 是 对 于 所 有 的 对 和 象 引 用 x 和 y， 
hashCode() 方法 必须 满足 以 下 两 个 属性 : 

。 如 果 x.equals(y) 为 true， 则 x.hashCode() 等 于 y.hashCode()。 = 

。 多 次 调用 x.hashCode() 返回 相同 的 整数 ， 前 提 是 对 象 在 调用 之 间 不 被 修改 。 

例如 ， 在 下 面 的 代码 片段 中 , x 和 y 引 用 的 是 相同 的 String 对 象 x.equals(y) 是 
true， 所 以 它们 的 散 列 码 必 须 相 同 ; x 和 z 引 用 的 是 不 同 的 String 对 象 ， 所 以 我 们 期 望 它们 的 
散 列 码 不 同 。 

String x = new String("Java");  // x.hashCode() 是 2301506 

String y = new String("Java");  // y:hashCode() 是 2301506 

String z= new String("Python"); // z.hashCode() 是 -1889329924 

在 一 个 典型 的 应 用 程序 中 ,我 们 使 用 散 列 码 把 一 个 对 象 x 映射 为 一 个 小 范围 内 的 整数 ， 
比如 在 0 到 m-1 之 间 ， 使 用 如 下 hash 函数 : 


private int hash(Object x) 
{ return Math.abs(x.hashCode() % m); } 





调用 Math.abs() 是 为 了 确保 返回 值 不 是 一 个 负 整 数 (在 x.hashCode() 为 负 的 情况 下 )。 我 
们 可 以 将 散 列 函数 值 作为 一 个 长 度 为 m 的 数组 的 整数 索引 (在 程序 3.3.4 和 程序 4.4.3 中 ， 这 
个 操作 的 效果 是 明显 的 )。 按 照 惯 例 ， 值 相等 的 对 象 必 须 具有 相同 的 散 列 码 ， 因 此 它们 也 具有 
相同 的 hash 函数 值 。 值 不 相等 的 对 象 可 以 拥有 相 
同 的 hash 函数 值 ， 但 我 们 期 望 hash 函数 将 元 个 典 
型 对 象 分 成 数量 大 致 相等 的 m 个 组 。 许 多 Java 的 
不 可 变数 据 类 型 (包括 String) 都 包含 hashCode() 


的 实现 ， 都 可 以 按照 合理 的 方式 分 布 对 象 。 public boolean equals(Object x) 
为 数据 类 型 编写 一 个 好 的 hashCode() 实现 要 | if (x == nul1) return false; 
求 结合 科学 与 工程 的 技巧 ， 这 超出 了 本 书 的 范围 。 gd 
作为 替代 方法 ， 我 们 描述 了 在 Java 中 实现 散 列 函 Complex that = (Conpled) x 
数 的 一 个 简单 有 效 的 方法 ， 并 且 适用 于 各 种 情况 : ehigin ~ that-in); 
确保 数据 类 型 是 不 可 变 的 。 public int hashCode() 
© 导入 java.util.Objects 类 。 { return Objects.hash(re, im); } 


s 通过 比较 所 有 重要 的 实例 变量 来 实现 equals()。 public String toString() 
。 通 过 将 所 有 重要 的 实例 变量 作为 静态 方法 ee 
Objects.hash() 的 参数 来 实现 hashCode()。 


静态 方法 Objects.hash() 为 其 参数 序列 生成 一 、 重 写 equals()、hashCode() 和 toString() 方法 


ee 
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个 散 列 码 。 例 如 ， 如 下 是 Complex 数据 类 型 的 hashCode() 实现 (程序 3.2.1 ) 和 我 们 刚刚 讨 
论 的 equals() 实现 : 

public int hashCode() 

{ return Objects.hash(re, im); } 

包装 类 型 。 继 承 的 主要 好 处 之 一 是 代码 复 用 。 但 是 ， 这 种 代码 复 用 仅 限 于 引用 类 型 〈 而 
不 是 基本 类 型 ) 。 例 如 ， 表 达 式 x.hashCode( 对 于 任何 对 象 引 用 
x 都 是 合法 的 ， 但 如 果 x 是 基本 类 型 的 变量 ， 则 编译 时 会 产生 错 
误 。 对 于 希望 将 基本 类 型 的 值 表示 为 对 象 的 情况 ，Java 提供 了 be a 
内 置 的 引用 类 型 ( 称 为 包装 类 型 )， 8 种 基本 类 型 都 有 其 对 应 的 包 he Ehapacttt 
装 类 型 ， 如 包装 类 型 Integer 和 Double 分 别 对 应 于 int 和 double。 double Doubis 


boolean Boolean 


包装 类 型 的 对 象 将 基本 类 型 的 值 “包装 ”到 对 象 中 ， 以 便 我 们 可 feat Float 
以 使 用 实例 方法 ， 如 equals() 和 hashCode()。 每 种 包装 类 型 都 是 oe 
不 可 变 的 ， 并且 包括 实例 方法 (如 用 于 在 数值 上 比较 两 个 对 象 的 Na te 


compareTo()) 和 静态 方法 〈 如 用 于 将 字符 串 转换 为 基本 类 型 的 
Integer.parseInt() 和 Double.parseDouble())。 

自动 包装 和 取消 包装 。Java 会 自动 在 包装 类 型 的 对 象 和 相应 的 基本 数据 类 型 值 (基于 
赋值 语句 、 方 法 参数 和 算术 /逻辑 表达 式 ) 之 间 进 行 转换 ， 以 便 我 们 可 以 编写 如 下 所 示 的 
代码 : 

Integer x = 17; // 自动 包装 (int ->Integer) 

int a = Xx; LV/ 取消 包装 (Integer ->int) 

在 第 一 条 语句 中 ，Java 自动 将 int 值 17 强制 转换 (自动 包装 ) 为 Integer 类 型 的 对 象 ， 
然后 将 其 分 配给 变量 x。 同 样 ， 在 第 二 条 语句 中 ，Java 在 将 该 值 赋 给 变量 a 之前， 自动 将 
Integer 对 象 转换 (取消 包装 ) 为 int 类 型 的 值 。 在 编写 代码 时 ， 自 动 包装 和 取消 包装 是 很 方 
便 的 功能 ， 但 这 些 功能 涉及 大 量 的 处 理 ， 可 能 会 影响 性 能 。 

为 了 代码 清晰 和 性 能 ， 我 们 尽 可 能 使 用 基本 类 型 数值 进行 计算 。 但 是 在 第 4 章 中 ， 我们 
将 遇 到 几 个 有 趣 的 例子 (特别 是 用 于 存储 对 象 集合 的 数据 类 型 )， 利 用 包装 类 型 和 自动 /取消 
包装 ， 我 们 能 够 无 须 修改 地 把 为 引用 类 型 开发 的 代码 复 用 于 基本 类 型 的 处 理 。 

应 用 : 数据 挖 扎 “为 了 在 应 用 程序 的 上 下 文 曾 明 这 一 节 中 讨论 的 一 些 概 念 ， 接 下 来 我 们 
将 介绍 一 种 软件 技术 一 一 数据 挖 据 ， 数 据 挖掘 描述 了 通过 搜索 大 量 信息 来 发 现 模 式 的 过 程 ， 
该 技术 被 证 明 对 于 解决 一 些 艰 巨 的 挑战 任务 非常 重要 。 数 据 挖掘 技术 可 以 作为 提高 Web 搜 
索 结果 的 质量 、 多 媒体 信息 检索 、 生 物 医学 数据 库 、 基 因 组 研究 、 改 进 许多 领域 的 学 术 研 
究 、 商 业 应 用 创新 、 研 究 犯 罪 分 子 的 计划 ， 以 及 许多 其 他 用 途 的 基础 。 因 此 ， 研 究 人 员 对 数 
据 挖掘 有 着 浓厚 的 兴趣 和 广泛 的 研究 。 

我 们 可 以 直接 访问 计算 机 中 的 数 千 个 文件 ， 并 可 以 间接 访问 Web 上 的 数 十 亿 文 件 。 正 
如 你 所 知道 的 ， 这 些 文件 非常 多 样 化 ， 有 商业 网 页 、 音 乐 和 视频 、 电 子 邮件 、 程 序 代 码 以 
及 各 种 其 他 信息 。 为 了 简单 起 见 ， 我们 只 关注 文本 文件 (尽管 我 们 研究 的 方法 同样 适用 于 图 
像 、 音 频 和 各 种 其 他 文件 )。 虽 然 限制 文件 类 型 为 文本 ,但 文本 文件 的 文档 类 型 也 有 很 大 的 
差异 。 作 为 参考 ， 读 者 可 以 在 本 书 官网 上 找到 这 些 文档 : 
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文件 名 称 描述 示例 文本 
Constitution. txt 法 律 文件 ... Of both Houses shall be determined by ... 
TomSawyer .txt 美国 小 说 ..."Say, Tom, let ME whitewash a little.” ... 
HuckFinn.txt 美国 小 说 .. .Was feeling pretty good after breakfast... 
Prejudice.txt 英国 小 说 ... dared not even mention that gentleman.... 
Picture.java Java 代 码 ...String suffix = filename.substring(file... 
DJIA.csv 财政 数据 .. .01-0ct-28,239.43,242.46,3500000,240.01 ... 
Amazon .html 网 页 源码 .….<table width="100%" border="0" cellspac... 
ACTG. txt 病毒 基因 组 ”.…. .GTATGGAGCAGCAGACGCGCTACTTCGAGCGGAGGCATA. . . 

一 些 文本 文档 


我 们 的 研究 目标 是 寻找 通过 文件 内 容 搜索 文件 的 有 效 方法 。 解 决 这 个 问题 的 一 个 有 效 
方法 是 将 每 个 文档 与 一 个 称 为 摘要 〈sketch) 的 向 量 相 关联 ， 这 个 摘要 是 其 内 容 的 浓缩 表示 。 
其 基本 思想 是 文档 摘要 应 该 捕获 文档 足够 的 统计 信息 ， 即 不 同 的 文档 具有 不 同 的 文档 摘要 ， 
相似 的 文档 具有 相似 的 文档 摘要 。 这 种 方法 能 够 区 分 一 本 小 说 、 一 个 Java 程序 和 一 个 基因 
组 ， 这 也 许 并 不 奇怪 , 但 你 可 能 会 惊讶 地 发 现 文档 摘要 居然 可 以 分 辨 出 不 同 作者 写 的 小 说 之 
间 的 区 别 ， 甚 至 可 以 作为 许多 其 他 细微 搜索 的 基础 。 

首先 ， 我 们 需要 文本 文档 的 抽象 。 什 么 是 文本 文档 ? 文本 文档 可 以 支持 哪些 操作 ?这 
些 问题 的 答案 涉及 该 如 何 设计 并 编写 代码 。 为 了 达到 数据 挖掘 的 目的 ， 第 一 个 问题 的 答案 很 
明显 ,文本 文档 是 由 一 个 字符 串 定义 的 。 第 二 个 问题 的 答案 是 ， 我 们 需要 能 够 计算 出 一 个 数 
字 ， 以 衡量 一 个 文档 和 任何 其 他 文档 之 间 的 相似 度 。 基 于 这 些 考 虑 ， 得 到 以 下 API: 


public class Sketch 





Sketch(String text, int k, int d) 
double similarTo(Sketch other) 这 个 文档 摘要 和 other 的 相似 性 测量 
String toStringO) 字符 串 表 示 
Sketch 的 API ( 见 程序 3.3.4 ) 


构造 函数 的 参数 为 一 个 字符 串 以 及 两 个 控制 文档 摘要 质量 和 大 小 的 整数 。 客 户 程序 可 以 
使 用 similarTo() 方法 来 确定 两 个 文档 摘要 的 相似 度 ， 相 似 度 的 范围 在 0( 不 相似 ) 到 1 (相似 ) 
之 间 。toString() 方法 主要 用 于 调试 。 这 种 数据 类 型 提供 了 实现 相似 性 度量 和 实现 通过 使 用 
度量 来 查找 文档 的 客户 程序 之 间 的 良好 分 离 。 

计算 文档 摘要 。 计 算 文档 摘要 是 第 一 个 挑战 。 我 们 将 使 用 一 系列 实数 (或 一 个 Vector) 
来 表示 文档 摘要 。 但 是 ， 文 档 摘要 应 该 包含 哪些 信息 ?如 何 计算 这 些 信息 ?目前 为 止 已 经 有 
许多 不 同 的 方法 ,研究 者 仍然 在 积极 寻求 解决 这 个 问题 的 高 效 算法 。 我 们 的 Sketch 实现 ( 程 
序 3.3.4 ) 使 用 简单 的 频率 统计 方法 。 构 造 函 数 包含 两 个 参数 : 整数 和 向 量 维度 ds 算法 扫 
描 文档 并 检测 文档 中 所 有 的 大 gram 一 一 从 每 个 位 置 开 始 的 长 度 为 的 子 字 符 串 。 文 档 摘要 最 
简单 的 形式 是 表示 字符 串 中 k-gram 相对 频率 的 向 量 : 对 于 每 一 种 可 能 的 -gram， 给 出 文档 
中 出 现 k-gram 的 数量 。 例 如 ,假设 我 们 在 基因 组 数据 中 使 用 本 2，4=16 (存在 4 种 可 能 的 字 
符 值 ， 因 此 有 4*=16 种 可 能 的 2-gram )。 

2-gram AT 在 字符 串 ATYAGATGCATAGCGCATAGC 中 出 现 4 次 ， 因 此 在 例子 中 对 应 AT 
的 向 量 元 素 将 是 4。 为 了 构造 频率 向 量 ， 我 们 需要 把 16 个 可 能 的 k-gram 中 的 每 一 个 转换 为 一 
个 0 到 15 之 间 的 整数 (该 函数 被 称 为 散 列 函数 )。 对 于 基因 组 数据 ， 请 参考 一 个 简单 的 练习 
(参见 练习 3.3.28 )。 然 后 ， 我 们 可 以 通过 扫描 文档 计算 一 个 数组 来 构建 频率 向 量 ， 每 个 万 gram 
对 应 数组 的 一 个 元 素 。 看 起 来 我 们 忽略 了 Kk-gram 的 顺序 而 丢失 了 信息 ， 但 明显 的 事实 是 信息 
内 容 中 顺序 的 重要 性 低 于 其 频率 。 如 果 我 们 要 考虑 顺序 的 问题 ， 可 以 使 用 马尔 可 夫 模 型 ， 与 





历 铅 对 彰 编 程 2 


我 们 在 1.6 节 研 究 的 随机 冲浪 者 并 无 不 同一 一 这 种 模型 对 于 顺序 研究 是 有 效 的 ， 但 是 需要 更 多 


的 工作 去 实现 它 。 在 Sketch 中 封装 计算 过 程 使 我 们 能 够 creeor™r 
灵活 地 尝试 各 种 设计 ， 而 无 须 重 写 Sketch 的 客户 代码 。 CCGCGCGTCT 
散 列 法 。ASCII 文本 字符 串 的 每 个 字符 都 可 能 有 128 cc 





个 不 同 的 取 值 ， 所 以 存在 128% 个 可 能 的 左 gram， 因 而 即 “2:Eam 散 列 计数 单位 向 量 计数 单位 向 量 
0 


使 采用 上 述 简单 的 方案 ,维度 4 也 必须 是 128*。 即使 对 和 ?0 0 ?0 
于 中 等 大 小 的 k， 这 个 数字 也 会 超级 庞大 。 对 于 Unicode,， AM ?2 4 508 1 :069 
其 字符 数 超过 65 536， 即 使 -gram 也 将 导致 巨大 的 向 量 人 4 3 381 3 -206 
文档 摘要 。 为 了 解决 这 个 问题 ， 我 们 使 用 散 列 法 ， 这 是 “< 5 0 0 4 375 
一 个 与 我 们 在 继承 中 讨论 过 的 搜索 算法 相关 的 基本 方法 。 ATT 
回想 一 下 ， 所 有 的 对 象 都 继承 了 一 个 hashCode() 方 法 ;oc 10 0 0 6 1 i A? 
该 方法 返回 一 个 在 -23 到 2 之 间 的 整数 。 给 定 任何 字符 ”处 车 
串 s， 我 们 使 用 表达 式 Math.abs(shashCode0%d) 来 产生 一 “天 3 4 3 5 42 

0 0 2 .137 


个 介 于 0 和 4-l 之 间 的 整数 散 列 值 ， 用 于 一 个 长 度 为 4 TT 
的 数组 以 计算 频率 。 我 们 采用 的 文档 摘要 是 由 文档 中 所 用 表格 表示 的 基因 组 数据 

有 大 gram 散 列 值 的 频率 定义 的 向 量 方 向 (与 原 向 量具 有 相同 方向 的 单位 向 量 )。 由 于 我 们 期 
望 不 同 的 字符 串 具 有 不 同 的 散 列 值 ， 因 此 具有 相似 gram 分 布 的 文本 文档 将 具有 相似 的 文 
档 摘 要 ， 并 且 具 有 不 同 的 k-gram 分 布 的 文本 文档 将 很 可 能 具有 不 同 的 文档 摘要 。 












程序 3.3.4 ”文档 摘要 





public class Sketch 
{ 


profile | 单位 后 
private final Vector profile; | 单位 向 量 
public Sketch(String text, int k, int d) 


int n = text.lengthO; 字 
doublel] Freq = mew doubield]: nane 下 文档 名 字 
for (Cint 1 = 0; i < n-k; i++) 


String kgram = text.substring(i, i+k); text .| 整个 文档 
int hash = kgram.hashCodeQO; 文档 长 度 

M . h = 1]; a 和 
freq[Math.abs(hash % d)] += 1 freq[] | 散 列 频率 


大 gram 的 散 列 值 












Vector vector = new Vector(Cfreq) ; 
profile = vector.direction(); 

} 

public double similarTo(Sketch other) 

{ return profile.dot(other.profile); } 


public static void main(String[] args) 


















int k = Integer.parseInt(args[0]); 
int d = Integer.parseInt(args[1]); 
String text = StdIn.readA110); 
Sketch sketch = new Sketch(text, k, d); 
StdOut.printin(sketch); 

} 








Vector 客户 程序 基于 文档 的 所 gram 构 建 了 一 个 d 维 单位 向 量 ， 客 户 程序 可 
以 用 它 来 度量 不 同文 档 之 间 的 相似 度 参见 正文 ) 。toString() 方 法 出 现在 
练习 3.3:15 中 。 


% more genome20 .txt 
ATAGATGCATAGCGCATAGC 

% java Sketch 2 16 < genome20.txt 

WO DA OO O00 0 7247 OB 







:» 0.496, 0.372, 0.248, 0.0) 
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比较 文档 摘要 。 第 二 个 挑战 是 计算 两 个 文档 摘要 之 间 的 相似 度 。 存 在 很 多 不 同 的 方法 来 
比较 两 个 向 量 ， 最 简单 的 可 能 就 是 计算 它们 之 间 的 欧 氏 距离 。 给 定向 量 x 和 yy， 欧式 距离 由 
下 面 的 式 子 定义 

x=p|=((Xo=po) +(x1-p1) + +(e ye) ) 

当 天 2 或 d=3 时 ,读者 很 熟悉 这 个 公式 。 对 于 Vector， 欧 几 里 得 距离 ( 欧 氏 距离 ) 的 计 
算 十 分 简单 。 如 果 x 和 y 是 两 个 Vector 对 象 ， 则 x.minus(y).magnitude0 是 它们 之 间 的 欧 氏 距 
离 。 如 果 文 档 相 似 ， 我 们 期 望 其 文档 摘要 之 间 的 欧 氏 距离 很 小 。 另 一 个 被 广泛 使 用 的 相似 性 
度量 ( 称 为 余弦 相似 性 度量 ) 更 简单 : 由 于 文档 摘要 是 具有 非 负 坐 标的 单位 向 量 ， 因 此 其 点 积 

XxX * y=XoyotXy1t""*+Xa1ya-1 
是 0 到 1 之 间 的 数值 。 在 几何 意义 上 ， 这 个 值 是 两 个 向 量 夹 角 的 余弦 ( 见 练习 3.3.10 )。 文 
档 越 相似 ,我们 期 望 这 个 度量 越 接 近 1。 

比较 所 有 的 文档 对 。CompareDocuments (程序 3.3.5 ) 是 一 个 简单 但 有 效 的 Sketch 客户 
程序 ， 提 供用 于 解决 以 下 问题 的 信息 : 给 定 一 组 文档 ， 找 到 最 相似 的 两 个 文档 。 因 为 这 份 规 
范 的 描述 具有 一 定 的 主观 性 ， 我 们 把 它 实 现 为 CompareDocuments， 它 的 作用 是 计算 输入 列 
表 中 所 有 文档 两 两 之 间 的 余弦 相似 性 度量 值 ， 并 把 结果 打印 出 来 。 对 于 中 等 大 小 的 上 和 4， 
文档 摘要 在 刻画 样本 文件 的 特征 方面 做 得 很 好 。 结 果 表 明基 因 组 数据 、 财 务 数据 、Java 代码 
和 Web 源 代码 与 法 律 文件 、 小 说 之 间 有 着 显著 差异 ， 小 说 《汤姆 . 索 
亚 》 和 《 哈 克 贝 利 : 芬 恩 》 之 间 的 相似 度 比 《 做 慢 与 偏见 》 的 相似 度 Zone te 
更 高 。 比 较 文学 的 研究 人 员 可 以 使 用 这 个 程序 来 发 现 文本 之 间 的 关系 。 rr gl 
教师 也 可 以 使 用 这 个 程序 来 检测 一 组 学 生 提 交 的 作业 是 否 存 在 抄 秦 行 ”prejudice.txt 
为 (事实 上 ,许多 教师 经 常 使 用 这 些 程序 )。 生 物 学 家 可 以 使 用 这 个 程 nj 人 te Java 
序 来 发 现 基因 组 之 间 的 关系 。 你 可 以 在 本 书 官网 上 找到 许多 文档 (或 ”Amazon.html 
者 也 可 以 试 试 你 自己 收藏 的 文件 )， 以 测试 各 种 参数 设置 下 
CompareDocuments 程序 的 有 效 性 。 

搜索 相似 的 文档 。Sketch 的 另 一 个 客户 程序 是 使 用 文档 摘要 在 大 量 文档 中 搜索 以 查找 与 
给 定 文档 类 似 的 文档 。 例 如 ，Web 搜索 引擎 使 用 类 似 的 客户 程序 向 用 户 展示 与 之 前 访问 的 网 
页 类 似 的 网 页 ， 在 线 图 书 商家 使 用 此 类 客户 程序 推荐 与 用 户 购 买 过 的 图 书 类 似 的 图 书 ， 社 交 
网 站 使 用 此 类 客户 程序 来 识别 与 用 户 个 人 兴趣 类 似 的 人 。 由 于 In 构造 函数 可 以 接收 网 址 而 
不 需要 文件 名 ， 所 以 我 们 完全 可 以 基于 它 编写 一 个 程序 ， 搜 索 Web、 计 算 网 页 的 文档 摘要 ， 
并 返回 一 些 目标 网 页 ， 这 些 网 页 的 摘要 与 用 户 查 找 的 页 面 摘要 相似 。 我 们 将 这 个 客户 程序 留 
给 读者 作为 一 个 具有 挑战 性 的 练习 。 

这 个 解决 方案 仅仅 是 一 个 概述 。 计 算 机 科学 家 尚 在 发 明和 研究 许多 计算 文档 摘要 并 对 其 
进行 比较 的 有 效 算法 。 我 们 目的 是 向 读者 介绍 这 个 基本 的 问题 领域 ， 
同时 阐述 解决 计算 挑战 时 抽象 的 强大 力量 。 向 量 是 一 种 基本 的 数学 
抽象 ， 我 们 可 以 通过 开发 抽象 层次 结构 ， 构 建 搜索 问题 的 解决 方案 : 
由 Java 数组 构建 Vector， 使 用 Vector 构建 Sketch， 客户 代码 使 用 
Sketch。 和 往常 一 样 ， 我 们 从 开发 这 些 API 的 许多 尝试 来 向 读者 详细 
介绍 这 个 抽象 ， 但 是 可 以 看 到 ， 数 据 类 型 是 根据 问题 的 需要 而 设计 
的 ， 同 时 又 考虑 了 实现 的 要 求 。 找 到 正确 的 抽象 设计 方案 和 合理 正 
确 的 代码 实现 是 有 效 的 面向 对 象 程 序 设计 的 关键 。 抽 和 象 的 强大 可 以 
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通过 数学 、 物 理 模 型 和 计算 机 程序 的 许多 例子 加 以 佐证 。 在 后 续 的 任务 中 ， 读 者 会 不 断 开发 
数据 类 型 以 应 对 自己 的 计算 挑战 。 你 会 变 得 越 来 越 熟 练 ， 也 将 会 越 来 越 欣 赏 这 种 强大 的 能 力 。 


程序 3.3.5 ”相似 性 检测 





public class CompareDocuments 


eV static void main(String[] args) k | gram 长 度 
int k = Integer.parseInt(args[0]); d | 维度 
int d = Integer.parseInt(args[1]); n | 文档 数量 


String[] filenames = StdIn.readAllStrings(); a[] | 所 有 文档 摘要 数组 
int n = filenames.length; 
Sketch[] a = new Sketch[n]; 
for (int 1 = 0; i < n; i++) 

a[i] = new tn In(filenames[i]).readA11(), k, d); 


StdOut .print(" “pe 

for (int j = 0; j < n; j++) 
StdOut.printf("%8.4s",filenames[j]); 

StdOut.print1nO; 

for (int 1 = 0; i < n; i++) 


StdOut.printf("%.4s", filenames[i]); 

for (int j = 0; j < ni j++) 
StdOut.printf("%8.2f", a[i].similarTo(a[j])); 

Std0ut.println0) ; 














这 个 Sketch 客户 程序 从 标准 输入 中 读 取 文档 列表 ， 根 据 所 有 文档 的 上 gram 
频率 计算 文档 摘要 ， 并 输出 所 有 文档 对 之 间 的 相似 度 度量 表 。 程序 从 命令 行 
中 接收 两 个 参数 : k 的 值 和 维度 d。 


% java CompareDocuments 5 10000 < documents.txt 


Cons 
TomS 
Huck 
Prej 
Pict 
DJIA 
Amaz 
ACTG 


Cons TomS Huck Prej Pict DJIA Amaz ACTG 
1.00 0.66 0.60 0.64 0.20 0.18 0.21 Waid 
0.66 1.00 0.93 0.88 0.12 0.24 0.18 0.14 


0.60 0.93 1.00 0.82 0.09 0.23 0.16 0.12 
0.64 0.88 0.82 1.00 0.11 0.25 0.19 0.15 
0.20 0.12 0.09 0.11 1.00 0.04 0.39 0.03 
0.18 0.24 0.23 0.25 0.04 1.00 0.16 0.11 
0.21 0.18 0.16 0.19 0.39 0.16 1.00 0.07 
0,11 0.14 0.12 0.15 0.03 0.11 0.07 1.00 


契约 式 设 计 € 最后， 我 们 简要 讨论 一 下 Java 语言 中 的 一 种 机 制 ， 它 可 以 用 于 用 户 在 程 
序 运行 时 检验 某 种 假设 。 例 如 ， 如 果 存 在 一 种 代表 粒子 的 数据 类 型 ， 则 可 能 会 断言 其 质量 是 
正 的 ， 且 速度 比 光 速 小 。 或 者 ， 如 果 存 在 一 个 计算 两 个 相同 维度 向 量 加 法 的 方法 ， 则 可 以 断 

结果 向 量 的 维度 也 保持 一 致 。 

异常 。 异 常 是 程序 运行 时 发 生 的 破坏 性 事件 ， 通 和 常 表示 一 种 错误 。 相 应 采取 的 措施 
被 称 为 抛 出 异常 4 我 们 在 学 习 程 序 设 计 的 过 程 中 已 经 遇 到 过 Java 标准 模块 抛 出 的 异常 ， 
ArithmeticException、 IllegalArgumentException、 NumberFormatException 和 ArrayIndexOnut- 
OfBoundsException 等 都 是 常见 的 异常 信息 。 

用 户 也 可 以 创建 并 抛 出 自己 的 异常 。Java 包含 一 个 精心 设计 的 预定 义 异 常 的 分 层 继承 结 
构 。 每 个 异常 类 都 是 java.lang.Exception 的 子 类 。 以 下 图 表 显 示 了 这 个 分 层 结构 的 一 部 分 。 


da 各 


274 常 3 拿 














IllegalArgumentException IndexOutOfBoundsException ArithmeticException 





NumberFormatException ArrayIndexOutOfBoundsException StringIndexOutOfBoundsException 


异常 的 子 类 继承 层次 (部 分 ) 


也 许 最 简单 的 异常 是 RuntimeException。 以 下 语句 创建 一 个 RuntimeException， 通 常会 
中 断 程序 的 执行 并 输出 一 个 错误 信息 。 


throw new RuntimeException("Custom error message here."); 


在 对 用 户 有 帮助 的 情况 下 使 用 异常 是 一 个 好 习惯 。 例 如 ,在 Vector (程序 3.3.3 ) 中 ， 当 
用 于 相 加 的 两 个 向 量 维度 不 一 致 时 ， 在 plus() 中 应 该 抛 出 一 个 异常 。 为 此 ， 在 plus() 的 开头 
插入 以 下 语句 : 


if (this.coords.length != that.coords.length) 
throw new IllegalArgumentException("Dimensions disagree."); 


通过 这 段 代 码 ， 客 户 程序 会 收 到 API 违规 的 精确 描述 ( Dimensions disagree 的 意思 是 
使 用 不 同 维度 的 向 量 调用 plus0 方法 )， 从 而 使 程序 员 能 够 识别 错误 。 如 果 没 有 上 述 代码 ， 
plus() 方法 的 结果 是 无 法 预计 的 ， 可 能 抛 出 一 个 ArrayIndexOutOfBoundsException 或 者 返回 
一 个 不 合 逻 辑 的 结果 ， 这 取决 于 这 两 个 向 量 的 维 数 (参见 练习 3.3.16 )。 

断言 。 断 言 是 一 个 布尔 表达 式 ， 用 于 确定 程序 执行 时 的 某 个 特定 点 应 该 为 tue。 如 果 表 
达 式 为 false， 程 序 将 抛 出 一 个 AssertionError， 通 常会 终止 程序 并 报告 错误 信息 。 错 误 就 像 
异常 ， 只 是 错误 表示 灾难 性 的 失败 。StackOverflowError 和 OutOfMemoryError 是 本 书 以 前 
提 到 过 的 两 个 例子 。 

程序 员 广 泛 使 用 断言 来 检测 错误 并 确保 程序 的 正确 性 。 断 言 也 用 来 记录 程序 员 的 意图 。 
例如 ， 在 Counter (程序 3.3.2 ) 中 ， 通 过 在 increment0 方法 的 最 后 增加 如 下 代码 ， 我 们 可 以 
检查 计数 器 是 否 为 负数 : 


assert count >= 0; 


这 个 声明 会 捕获 计数 器 值 为 负 的 情况 。 读 者 还 可 以 添加 自 定义 信息 


assert count >= 0 : "Negative count detected in increment()”; 


来 帮助 查找 错误 。 在 默认 情况 下 ， 断 言 功 能 是 被 关闭 的 ， 相 应 语句 会 被 直接 忽略 ,但 是 可 以 
通过 使 用 -enableassertions 标记 (简写 为 -ea) 从 命令 行 启 用 。 断 言 仅 用 于 调试 ， 正 常 运 行 时 
程序 不 能 依赖 于 断言 (因为 断言 可 能 被 关闭 )。 

如 果 读 者 选修 了 系统 编程 的 课程 ， 将 会 学 到 如 何 使 用 断言 来 确保 代码 不 会 因 系统 错误 而 
终止 或 进入 无 限 循 环 。 一 种 称 为 契约 式 设计 的 模型 表述 了 这 种 设计 理念 。 数 据 类 型 的 设计 者 
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规定 一 个 前 置 条 件 ( 调 用 一 个 方法 时 必须 满足 的 条 件 )、 一 个 后 置 条 件 ( 从 方法 返回 时 确保 达 
成 的 条 件 )、 不 变量 (运行 过 程 中 实现 要 确保 满足 的 任何 条 件 ) 以 及 副作用 (方法 可 能 导致 的 
任何 其 他 状态 变化 )。 在 开发 过 程 中 ， 可 以 用 断言 来 测试 这 些 条 件 。 许 多 程序 员 使 用 断言 来 
帮助 调试 。 

本 节 讨 论 的 语言 机 制 说 明了 数据 类 型 设计 的 理念 和 功效 可 以 帮助 我 们 深入 了 解 编程 语 
言 的 设计 。 专 家 们 依旧 在 争论 支持 其 中 一 些 设 计 理 念 的 最 好 方法 。 为 什么 Java 不 允许 函数 
作为 方法 的 参数 ? 为 什么 Python 不 提供 强制 封装 的 语言 支持 ? 为 什么 Matlab 不 支持 可 变数 
据 类 型 ? 正如 第 1 章 所 述 ， 与 其 抱怨 一 种 编程 语言 的 特点 ， 还 不 如 成 为 一 种 编程 语言 的 设计 
者 。 如 果 这 不 是 你 的 计划 ,那么 最 佳 策略 是 采用 广泛 使 用 的 程序 设计 语言 。 大 多 数 系 统 提 
供 大 量 的 库 (适当 的 时 候 你 肯定 会 采用 ), 但 是 通过 构建 抽象 ， 常 常 可 以 在 简化 客户 代码 的 
同时 确保 代码 的 正确 性 ， 并 可 以 轻松 转移 到 其 他 程序 设计 语言 。 你 的 主要 目标 是 开发 数据 类 
型 ， 以 便 大 部 分 工作 适合 在 问题 的 抽象 层面 上 完成 。 
问答 环节 

问 : 如 果 尝 试 访问 男 一 个 类 的 私有 实例 变量 或 方法 ， 会 发 生 什么 ? 

答 : 将 得 到 一 个 编译 时 错误 ,错误 提示 大 意 为 给 定 的 实例 变量 或 方法 在 给 定 的 类 中 具有 
私有 访问 权限 。 

问 : Complex 中 的 实例 变量 是 私有 的 ， 但 是 当 使 用 aplus(b) 为 Complex 对 象 执 行 方 法 
plus() 时 ， 我 们 不 仅 可 以 访问 实例 变量 a， 还 可 以 访问 b。b 的 实例 变量 不 应 该 不 能 访问 吗 ? 

答 : 私有 访问 的 粒度 在 类 级 别 而 不 是 实例 级 别 。 将 实例 变量 声明 为 私有 意味 着 其 不 能 从 
任何 其 他 类 直接 访问 。Complex 类 中 的 方法 可 以 访问 ( 读 取 或 写 入 ) 该 类 中 任何 对 象 的 实例 
变量 。 有 一 个 限制 性 更 强 的 访问 修饰 符 可 能 会 更 好 (比如 superprivate)， 这 会 在 实例 级 别 的 
粒度 上 限制 私有 访问 ， 以 便 只 有 调用 对 象 才能 访问 其 实例 变量 ,但 是 Java 没有 这 样 的 功能 。 

问 : Complex (程序 3.3.1 ) 中 的 times() 方 法 需要 一 个 构造 函数 ， 以 极 坐 标 作为 参数 。 
如 何 添加 这 样 的 构造 晴 数 ? 

答 : 我 们 不 能 添加 这 样 的 构造 函数 ， 因 为 已 经 有 需要 两 个 浮 点 数 作为 参数 的 构造 函数 。 
一 种 更 佳 的 方案 是 在 API 中 添加 两 个 常用 的 函数 createRect(x, y) 和 createPolar(r theta)。 这 
种 设计 方案 更 好 ， 因 为 它 给 客户 程序 提供 了 通过 指定 矩形 或 极 坐标 来 创建 对 象 的 功能 。 这 个 
例子 说 明 开 发 数据 类 型 时 ， 考 虑 多 种 实现 方法 是 一 个 不 错 的 主意 。 

问 : 本 节 中 定义 的 Vector (程序 3.3.3 ) 数据 类 型 与 Java 的 java.util.Vector 数据 类 型 之 
间 是 否 存 在 关系 ? 

答 : 不 存在 关系 ， 只 是 因为 向 量 确实 是 线性 代数 和 向 量 演算 的 术语 ， 所 以 我 们 使 用 这 个 
名 称 。 

问 : Vector (程序 3.3.3 ) 中 的 direction() 方法 如 果 用 全 零 向 量 调用 ， 程序 应 该 返回 什么 ? 

答 : 一 个 完整 的 API 应 该 考虑 到 每 种 情况 下 每 种 方法 的 行为 。 在 这 种 情况 下 ， 抛 出 异 
常 或 返回 null 是 适当 的 。 

问 : 什么 是 已 弃 用 的 方法 ? 

答 : 一 种 不 再 完全 支持 的 方法 ， 但 保留 在 API 中 以 保持 兼容 性 。 例 如 ，Java 曾经 包含 
一 个 方法 Character.isSpace() ， 程 序 员 编写 依赖 于 该 方法 的 操作 的 程序 。 当 Java 的 设计 者 希 
望 支 持 更 多 的 Unicode 空格 字符 时 ， 他 们 无 法 在 不 破坏 客户 程序 的 情况 下 改变 isSpace() 的 
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行为 。 为 了 解决 这 个 问题 ,设计 者 添加 了 一 个 新 的 方法 Character.isWhiteSpace()， 并 且 弃 用 
旧 的 方法 。 随 着 时 间 的 推移 ， 这 种 做 法 肯定 会 使 API 复杂 化 。 
问 : 如 下 Complex 的 equals0 的 实现 有 什么 错误 ? 


public boolean equals(Complex that) 


return (this.re == that.re) && (this.im == that.im); 
3 


答 : 这 段 代 码 重 载 了 equals() 方法 ， 而 不 是 重 写 方法 。 也 就 是 说 ， 代 码 定义 了 一 个 名 为 
equals() 的 新 方法 ， 这 个 方法 接收 一 个 Complex 类 型 的 参数 。 这 个 重 载 的 方法 不 同 于 继承 的 
方法 equals()， 继 承 的 方法 接收 一 个 Object 类 型 的 参数 。 在 一 些 情况 下 ， 如 我 们 在 4.4 节 中 
讨论 的 java.util.HashMap 库 ， 这 个 库 调用 继承 的 方法 而 不 是 重 载 的 方法 ， 因 此 导致 令 人 费解 
的 行为 。 

问 : 如 下 Complex 的 hashCode() 有 什么 错误 ? 

public int hashCodeQ) 

{ return -17; } 

答 : 技术 上 讲 ， 它 满足 hashCode() 的 约定 : 如 果 两 个 对 象 相等 ， 则 它们 具有 相同 的 散 
列 码 。 然 而 ， 由 于 我 们 希望 Math.abs(x.hashCode0%m) 将 nn 个 典型 Complex 对 象 分 成 大 小 
相等 的 m 组 ， 因此 可 能 会 导致 性 能 不 佳 。 

问 : 一 个 接口 可 以 包含 构造 函数 吗 ? 

答 : 不 可 以 ， 因 为 我 们 不 能 实例 化 一 个 接口 ， 只 能 实例 化 实现 类 的 对 象 。 但 是 ， 一 个 
接口 可 以 包括 常量 、 方 法 签名 、 默 认 方 法 、 静 态 方 法 和 肉 套 类 型 ， 这些 功能 超出 了 本 书 的 
范围 。 

问 : 一 个 类 可 以 是 多 个 类 的 直接 子 类 吗 ? 

答 : 不 可 以 。 每 个 类 (Objeet 除外 ) 都 是 一 个 且 只 能 是 一 个 父 类 的 直接 子 类 。 这 个 特性 
被 称 为 单 继 承 。 某 些 其 他 语言 (特别 是 C++) 支持 多 继承 ， 一 个 类 可 以 是 两 个 或 更 多 父 类 的 
直接 子 类 。 

问 : 一 个 类 可 以 实现 多 个 接口 吗 ? 

答 : 可 以 。 为 了 实现 多 个 接口 ， 请 在 关键 字 implements 后 列 出 每 个 要 实现 的 接口 ， 接 
口 之 间 由 逗号 分 隔 。 

问 : Lambda 表达 式 的 主体 可 以 包含 多 个 单独 的 语句 吗 ? 

答 : 可 以 ,主体 可 以 是 一 个 语句 块 ， 可 以 包含 变量 声明 、 循 环 和 条 件 。 在 这 种 情况 下 ， 
必须 使 用 显 式 的 return 语句 来 指定 Lambda 表达 式 的 返回 值 。 

问 : 在 某 些 情况 下 , Lambda 表达 式 只 能 在 男 一 个 类 中 调用 命名 方法 。 有 没有 简写 形式 ? 

答 : 有 ， 方 法 引用 是 一 个 紧凑 是 易 读 的 Lambda 表达 式 ， 用 于 已 经 具有 名 称 的 方法 。 例 
如 ， 我们 可 以 使 用 方法 引用 Gaussian: : pdf 作为 Lambda 表达 式 x ->Gaussian.pdf(x) 的 简写 。 
有 关 详 细 信息 ， 请 参阅 本 书 官网 。 
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3.3.1 ”请 使 用 int 来 存储 自 1970 年 1 月 1 日 以 来 的 秒 数 ， 用 来 表示 一 个 时 间 点 。 使 用 此 表示 法 的 程序 
何 时 会 面 对 时 间 爆 炸 ? 发 生 这 种 情况 时 该 如 何 处 理 ? 


3.3.8 


了 访 人 


3:.330 
33,11 
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.3.3 


3.3.14 


.83.15 
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3 
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请 创建 一 个 数据 类 型 Location， 使 用 球 坐 标 〈 纬 度 /经 度 ) 处 理 地 球 上 的 位 置 。 请 在 数据 类 型 中 
包含 在 地 球 表面 生成 随机 位 置 的 方法 ， 解 析 字 符 串 “25.344 N，63.5532 W” 得 到 一 个 位 置 ， 并 
计算 两 个 位 置 之 间 的 大 圆 距 离 。 

请 使 用 Counter (程序 3.3.2 ) 为 Histogram (程序 3.2.3 ) 开发 一 种 新 的 实现 。 

请 使 用 其 他 Vector 方法 (如 direction() 和 magnitude()) 来 为 Vector 重新 实现 一 个 minus() 方法 。 
答案 : 


public Vector minus(Vector that) 
{ return this.plus(that.scale(-1.0)); } 


这 种 实现 的 优点 是 限制 了 要 检查 的 详细 代码 的 数量 ,缺点 是 代码 可 能 是 低 效 的 。 在 这 种 情 
况 下 ，plus() 和 times() 都 会 创建 新 的 Vector 对 象 ， 性 能 会 很 低 。 这 时 如 果 出 于 性 能 的 考虑 复制 
plus( 的 代码 过 来 并 把 加 号 改 为 减 号 可 能 是 一 种 更 好 的 实现 方法 。 

为 Vector 实现 一 个 main( 方法 来 对 其 方法 进行 单元 测试 。 
请 创建 一 个 数据 类 型 ， 使 用 位 置 (xr,ry,r:)、 质 量 ( m) 和 速度 (vv,v:) 表示 三 维 空间 粒子 。 数 
据 类 型 中 包含 一 个 返回 其 动能 的 方法 ,动能 计算 公式 为 /2mz(vstw+v)。 请 使 用 Vector 数据 类 
型 (程序 3.3.3 )。 
如 果 读 者 熟悉 物理 学 ， 请 开发 上 一 道 练习 中 数据 类 型 的 另 一 个 版 本 ， 使 用 动量 ( p;, p,, p:) 作为 
实例 变量 。 
请 实现 与 Vector 具有 相同 API 的 二 维 向 量 数据 类 型 Vector2D ， 唯 一 的 不 同 是 其 构造 函数 接收 两 
个 double 值 作为 参数 。 使 用 两 个 double 值 (而 不 是 一 个 数组 ) 作为 实例 变量 。 
请 实现 前 面 练习 中 的 Vector2D 数据 类 型 ， 使 用 一 个 Complex 对 象 作 为 唯一 的 实例 变量 。 
请 证 明 两 个 二 维 单位 向 量 的 点 积 等 于 其 夹 角 的 余弦 值 。 
请 实现 一 个 数据 类 型 Vector3D ， 用 于 表示 三 维 向量 ， 与 Vector 具有 相同 API， 唯 一 的 不 同 是 
其 构造 函数 的 参数 是 三 个 double 值 。 另 外 ,增加 一 个 又 积 方法 : 两 个 向 量 的 又 积 的 结果 是 另 
一 个 向 量 ， 其 定义 公式 如 下 : 
axXb=clallblsin0 
其 中 c 是 同时 垂直 于 a 和 4b 的 单位 法 向 量 ,9 是 a 和 4b 之 间 的 夹 角 。 在 直角 坐标 系 中 ， 下 
面 的 等 式 定义 了 又 积 : 
(a0,a1,42) X (bo,b1,b;2)=(ai D2=-az Di, az po-ao b;, ao bi-ai bo) 
叉 积 出 现在 力矩 、 角 动量 和 疝 量 算 子 旋 度 的 定义 中 。 男 外 ，|a Xb| 是 边 长 为 a 和 4b 的 平行 
四 边 形 的 面积 。 
请 重 写 Charge (程序 3.2.6 ) 的 equals() 方法 ,使 得 两 个 Charge 对 象 在 具有 相同 的 位 置 和 电荷 
值 时 相等 。 使 用 本 节 中 描述 的 Objects.hash() 技术 重 写 hashCode() 方法 。 
请 重 载 Vector (程序 3.3.3 ) 的 equals() 方 法 和 hashCode() 方法 ,使 得 两 个 长 度 相等 且 对 应 的 
坐标 相等 的 Vector 对 象 相等 。 
请 向 Vector 添加 一 个 toString0 方法 ， 方 法 返回 向 量 的 组 成 部 分 ， 使 用 逗号 分 隔 ， 并 用 括号 括 起 来 。 
请 在 Sketch 中 添加 toString0 方法 ， 该 方法 返回 与 文档 摘要 对 应 的 单位 向 量 的 字符 串 表 示 形 式 。 
如 果 x 对 应 于 向 量 (1,2,3 ), y 对 应 于 向 量 (5，5 )， 描 述 Vector (程序 3.3.3 ) 中 方法 调用 x.add(y) 
和 yadd(x) 的 行为 。 
请 使 用 断言 和 异常 来 开发 一 个 Rational 的 实现 ， 使 得 程序 不 受 滋 出 的 影响 (参见 练习 3.2.7 )。 
请 在 Counter (程序 3.3.2) 中 添加 代码 ， 如 果 客 户 端 尝试 使 用 一 个 负 值 的 max 创建 一 个 


dt 


Counter 对 象 ， 则 在 运行 时 抛 出 IllegalArgumentException。 
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这 一 组 练习 题 旨 在 帮助 读者 获得 更 多 开发 数据 类 型 的 经 验 。 针 对 每 个 问题 ， 设 计 一 个 或 多 个 API 

及 API 实 现 ， 通 过 实现 典型 的 客户 代码 来 测试 设计 方案 的 正确 性 。 一 些 练习 需要 知道 特定 领域 的 知 

识 , 或 者 通过 Web 查找 相关 信息 。 

3.3.19 统计 。 请 开发 一 个 数据 类 型 ， 用 于 维护 一 组 实数 的 统计 信息 。 提 供 一 种 方法 来 增加 数据 点 ， 
并 提供 相应 的 方法 以 返回 点 的 数量 、 均 值 、 标 准 差 和 方差 。 开 发 两 种 实现 . 一 个 实现 的 实例 
变量 是 点 的 数量 、 值 的 和 、 值 的 平方 和 ， 另 一 个 实现 的 实例 变量 则 存储 包含 所 有 数据 点 的 数 
组 。 为 了 简单 起 见 ， 构 造 函 数 可 以 指定 一 个 最 大 数据 点 数量 的 参数 。 第 一 个 实现 的 速度 更 快 ， 
消耗 的 内 存 更 少 ， 但 更 容易 出 现 舍 人 误差 。 更 好 的 替代 方案 可 以 参考 本 书 官网 。 

3.3.20 基因 组 。 开 发 一 个 数据 类 型 来 存储 生物 体 的 基因 组 。 生 物 学 家 经 常 将 基因 组 抽象 成 核 苷 酸 
序列 (A、C、G 或 T)。 数 据 类 型 应 该 支持 方法 addCodon(char c)、nucleotideAt(inti) 以 及 
isPotentialGene(0) 〈 见 程序 3.1.1 )。 请 开发 以 下 三 个 实现 。 第 一 个 实现 使 用 一 个 String 类 型 的 
实例 变量 ， 使 用 字符 串 拼接 操作 实现 addCodon()。 每 个 方法 调用 花费 的 时 间 都 与 当前 基因 组 
长 度 成 比例 。 第 二 个 实现 使 用 一 个 字符 数组 作为 实例 变量 ， 每 当 数 组 被 填 满 时 长 度 会 增加 一 
浊 。 第 三 个 实现 使 用 一 个 布尔 数组 ， 每 个 碱 基 使 用 两 位 二 进 制 编码 ， 并 且 每 当 数 组 填 满 时 ， 
数组 的 长 度 增加 一 倍 。 

3.3.21 ”时间 。 开 发 一 个 表示 一 天 时 间 的 数据 类 型 。 请 提供 返回 当前 小 时 、 分 钟 和 秒 的 方法 ， 以 及 
toString()、equals() 和 hashCode() 方法 。 开 发 两 种 实现 : 一 种 将 时 间 存 储 为 一 个 int 值 ( 自 午 
夜 12 点 钟 以 来 的 秒 数 )， 另 一 种 将 时 间 存 储 为 三 个 int 值 ， 分 别 表示 秒 、 分 钟 和 小 时 。 

3.3.22 ”VIN 号 码 。 请 开发 数据 类 型 VIN， 针 对 称 为 车 辆 识别 号 码 ( VIN) 的 命名 方案 。VIN 描述 了 美 
国 汽车 、 公 共 汽 车 和 卡车 的 品牌 、 型 号 、 年 份 和 其 他 属性 。 

3.3.23 生成 伪 随 机 数 。 请 开发 一 个 生成 伪 随 机 数 的 数据 类 型 ， 即 将 StdRandom 转换 为 数据 类 型 。 不 
使 用 Math.random()， 数 据 类 型 需 基 于 线性 同 余 产生 器 。 这 种 方法 可 以 追溯 到 计算 机 产生 初 
期 ， 也 是 一 个 在 计算 中 存储 状态 值 的 典型 例子 。 按 照 如 下 方案 设计 一 个 数据 类 型 : 若 要 生成 
伪 随 机 int 值 ， 请 存储 一 个 int 值 x (返回 的 最 后 一 个 “随机 ”数字 的 值 )。 每 次 客户 端 请 求 
一 个 新 值 时 ， 返 回 a*x+b， 这 时 我 们 需要 选择 适当 的 a 和 b 的 值 (忽略 溢出 )， 使 用 算术 将 这 
些 值 转换 为 其 他 类 型 数据 的 “随机 ” 值 。D. E. Knuth 建议 ，a 使 用 值 3141592621，b 使 用 值 
2718281829。 数 据 类 型 需要 提供 一 个 构造 函数 ， 人 允许 客户 程序 以 一 个 指定 的 int 值 作为 开始 
(这 个 x 的 初始 值 被 称 为 种 子 )。 这 种 功能 清楚 地 表明 ， 产 生 的 数字 根本 不 是 随机 的 (尽管 它们 
可 能 具有 许多 随机 数 的 属性 )， 但 是 这 个 事实 可 以 用 来 帮助 调试 ， 因 为 客户 程序 可 以 设计 成 每 
次 都 生成 相同 的 数字 。 


创新 练习 
3.3.24 封装。 下 面 的 类 是 不 可 变 的 吗 ? 


import java.util.Date; 

public class Appointment 
private Date date; 
private String contact; 


public Appointment(Date date) 
{ 


了 2 
8:3:26 


3 


3.3.28 


R29 


3.3.30 


3331 


3.4 
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this.date = date; 
this.contact = contact; 


public Date getDate() 
{ return date; } 


} 


答案 : 不 是 。Java 的 java.util.Dateclass 类 是 可 变 的 。 方 法 setDate(seconds) 将 调用 日 
期 的 值 更 改 为 自 1970 年 1 月 1 日 00:00:00 GMT 以 来 的 毫秒 数 。 这 将 产生 一 个 灾难 性 的 后 
果 ， 当 一 个 客户 程序 获得 date=getDate() 的 日 期 时 ， 客 户 程 序 可 以 调用 date.setDate() 并 更 
改 Appointment 对 象 类 型 中 的 日 期 ， 这 可 能 会 产生 冲突 。 在 一 个 数据 类 型 中 , 不 允许 可 变 
对 象 的 引用 转 义 ， 因 为 调用 者 可 能 会 修改 其 状态 。 这 个 问题 的 一 种 解决 方案 是 在 使 用 new 
Date(date.getTime()) 返回 日 期 之 前 创建 Date 的 防御 拷贝 。 当 通过 this.date=new Date(date. 
getTime()) 存储 时 ， 它 是 一 个 防御 拷贝 。 很 多 程序 员 认 为 Date 的 可 变性 是 Java 设计 的 一 个 缺 
陷 (GregorianCalendar 是 一 个 更 现代 的 用 于 存储 日 期 的 Java 库 ， 但 它 也 是 可 变 的 )。 
日 期 。 开 发 Java 的 java.util.Date API 的 实现 ， 使 其 不 可 变 ， 因 而 可 以 修正 上 述 练 习 的 缺陷 。 
日 历 。 开 发 Appointment 和 CalendarAPI， 可 用 于 记录 日 历年 中 的 约会 ( 按 天 )。 目 标 是 让 客户 
程序 能 够 安排 不 会 冲突 的 约会 ， 并 向 用 户 报告 当前 约会 。 
向 量 场 。 向 量 场 将 向 量 与 欧 几 里 得 空间 中 的 每 个 点 相关 联 。 请 编写 另 一 个 版 本 的 Potential ( 练 
习 3.2.23 )， 从 输入 接收 一 个 大 小 为 元 的 网 格 ， 基 于 在 nXn 网 格 中 等 距离 分 布点 的 点 电荷 ， 计 
算 每 个 点 电势 向 量 值 ， 并 在 每 个 点 绘制 电场 方向 的 单位 向 量 (修改 Charge 来 返回 一 个 Vector)。 
基因 组 草图 。 编 写 一 个 函数 hash()， 以 一 个 gram (长 度 为 的 字符 串 ) 作为 参数 ， 其 字符 
由 A、C、G 或 组成， 并 返回 一 个 介 于 0 到 4:-1 之 间 的 int 值 ， 相 当 于 将 字符 串 转换 为 四 进 
制 (基数 为 4) 的 数字 ,即将 {A，C，G, T} 分 别 转换 为 {0,1,2,3}。 接 下 来 ， 编 写 一 个 函数 
unHash() 来 实现 逆 变 换 。 使 用 方法 创建 一 个 类 似 于 Sketch (程序 3.3.4 ) 的 类 Genome， 但 是 类 
Genome 要 基于 基因 组 中 k-grams 的 精确 计数 。 最 后 ， 为 Genome 对 象 编写 CompareDocuments 
(程序 3.3.5 ) 的 一 个 版 本 ， 用 于 查找 本 书 官网 上 一 组 基因 组 文件 之 间 的 相似 性 。 
概要 分 析 。 从 本 书 官网 上 选择 若干 感 兴趣 的 文档 (或 者 使 用 你 自己 收集 的 一 组 文档 )， 使 用 多 
组 命令 行 参数 k 和 d 的 值 来 运行 CompareDocuments， 以 体会 参数 对 计算 的 影响 。 
多 媒体 搜索 。 请 开发 用 于 音频 和 图 片 的 摘要 策略 ， 并 使 用 它们 来 发 现 自己 计算 机 上 音频 库 中 
歌曲 的 相似 度 和 相册 中 照片 之 间 的 相似 度 。 
数据 挖掘。 请 编写 一 个 用 于 浏览 Web 页 面 的 递归 程序 ， 从 第 一 个 命令 行 参数 指定 的 页 面 开 始 ， 
查找 与 第 二 个 命令 行 参数 指定 的 页 面相 似 的 页 面 ， 处 理 过 程 如 下 : 处 理 名 称 ,， 打 开 输入 流 ， 执 
行 readAll10， 计 算 文档 摘要 ， 如 果 它 与 目标 页 面 的 距离 大 于 第 三 个 命令 行 参数 所 给 定 的 阔 值 ， 
则 输出 其 名 称 。 然 后 扫描 readAll 得 到 文字 串 中 所 有 以 “ http://” 字 符 串 开头 的 页 面 并 (递归 
地 ) 处 理 带 有 这 些 名 称 的 页 面 。 注 意 : 这 个 程序 可 能 会 读 取 大 量 的 Web 页 面 ! 


案例 研究 : 多 体 模 拟 


第 1 章 和 第 2 章 讨论 的 几 个 例子 可 以 更 清晰 地 表述 面向 对 象 的 程序 设计 。 例 如 ， 我 们 
可 以 将 BouncingBall (程序 3.1.9 ) 实现 为 一 个 值 为 球 的 位 置 和 速度 的 数据 类 型 ， 客 户 程序 
则 调用 方法 来 移动 和 绘制 球 。 这 种 数据 类 型 为 客户 程序 提供 更 大 能 力 ， 如 可 以 同时 模拟 几 个 
小 球 的 运动 (参见 练习 3.4.1 )。 同 样 ，2.4 节 中 Percolation 的 案例 研究 ， 以 及 1.6 节 中 随机 
冲浪 的 案例 研究 ， 很 显然 都 可 以 作为 面向 对 象 程序 设计 的 有 趣 练习 。Percolation 将 作为 练习 


280 党 了 蔓 


3.4.8， 随 机 冲浪 者 的 面向 对 象 程序 设计 将 在 4.5 节 中 重新 讨论 。 在 本 节 ， 我 们 将 研究 一 个 新 
的 程序 来 演示 面向 对 象 程序 设计 方法 。 

我 们 的 任务 是 编写 一 个 程序 ， 动 态 模拟 多 个 物体 在 相互 引力 吸引 作用 下 的 运动 状况 。 这 
个 多 体 模拟 问题 最 初 由 艾 萨 克 ' 牛顿 (Isaac Newton) 在 350 多 年 前 提出 ， 至 今 依然 是 热门 
的 研究 话题 。 

数据 类 型 应 该 包含 什么 值 的 集合 ， 有 哪些 作用 于 这 些 值 的 操作 ?. 本 节 分 析 的 案例 是 面向 
对 象 程 序 设计 中 引 人 注 目的 例子 ， 其 原因 之 一 是 ， 它 提出 了 在 真实 世界 的 物理 对 象 与 程序 中 
使 用 的 抽象 对 象 之 间 直 接 且 自然 的 对 应 关系 。 对 于 许多 新 手 而 言 ， 解 决 问题 的 方法 从 编写 执 
行 语句 序列 转换 到 设计 数据 类 型 是 困难 的 。 随 着 经 验 的 积累 ， 应 用 这 种 方法 解决 计算 问题 会 
使 读者 从 中 受益 。 

首先 ,我们 回忆 一 下 高 中 物理 学 过 的 一 些 基 本 概念 和 公式 。 理 解 程序 代码 并 不 需要 完 
全 理解 这 些 公式 ， 由 于 采用 了 封装 ， 这 些 公式 仅仅 出 现在 几 个 方法 中 。 而 且 由 于 采用 了 数据 
抽象 ， 大 多 数 代码 非常 直观 且 容 易 理 解 。 从 某 种 意义 上 说 ,这 就 是 面向 对 象 程序 设计 的 最 终 
目标 。 

多 体 模 拟 1.5 节 中 的 弹跳 小 球 模拟 基于 牛顿 第 一 运动 定律 : 任何 物体 都 保持 匀速 直线 
运动 或 静止 状态 ， 直 到 外 力 迫 使 它 改 变 运动 状态 。 通 过 牛顿 第 二 运动 定律 (这 解释 了 外 力 如 
何 影响 运动 速度 ) 改善 这 个 例子 ， 产生 了 一 个 令 科 学 家 着 迷 很 长 时 间 的 一 个 基本 问题 。 多 体 
问题 即 给 定 n 个 物体 的 系统 (这 些 物体 通过 万 有 引力 相互 作用 )， 如 何 描 述 其 运动 轨迹 。 同 
一 个 基本 模型 适用 于 从 天 体 物 理学 到 分 子 动 力学 的 各 种 问题 。 

1687 年 ， 牛 顿 在 其 著作 《自然 哲学 的 数学 原理 》 中 阐述 了 两 个 物体 在 相互 引力 作用 下 
运动 的 原理 。 但 是 ， 牛 顿 却 无 法 构建 三 个 物体 运动 规律 的 数学 模型 。 研 究 已 经 表明 ， 描 述 三 
个 物体 运动 规律 的 基本 方法 根本 就 不 存在 ,而 且 在 不 同 的 初始 条 件 下 ， 三 个 物体 的 运动 行为 
还 可 能 导致 混乱 。 为 了 研究 此 类 问题 ， 科 学 家 不 得 不 求助 于 开发 一 个 精确 的 模拟 程序 。 在 本 
节 中 ， 我 们 开发 了 一 个 面向 对 象 的 程序 来 实现 这 种 模拟 。 科 学 家 热衷 于 研究 数量 众多 的 物体 
的 运动 规律 ， 我 们 的 解决 方案 仅仅 是 对 这 个 问题 的 入 门 介绍 。 不 过 ,结果 可 能 会 使 你 感到 惊 
讶 ， 因 为 我 们 可 以 开发 出 逼真 的 图 像 来 描绘 复杂 的 运动 。 

Body 数据 类 型 。 在 BouncingBall (程序 3.1.9 ) 中 ,我 们 使 用 double 型 变量 rx 和 ry 存 
储 小 球 离 原点 的 距离 ， 使 用 double 型 变量 vx 和 vy 存储 球 的 速度 ,使 用 如 下 语句 实现 小 球 
在 一 个 时 间 单 位 内 的 位 移 总 量 : 


rx = rx + VX; 
ry= ry + Vy; 


使 用 Vector (程序 3.3.3 )， 我 们 可 以 在 向 量变 量 r 中 存 
储 位 置 ， 在 向 量变 量 v 中 存储 速度 ， 然 后 使 用 一 条 语句 计算 “2 二 
小 球 在 dt 时 间 单 位 内 的 位 移 总 量 : 


r= r.plus(v.times(dt)); 


在 多 体 模拟 中 ,我们 将 使 用 类 似 的 操作 ， 所 以 首要 的 设 
计 决 策 是 使 用 Vector 对 象 代 替 单 独 的 x 和 y 分量。 ; 

这 个 决策 能 使 代码 更 清晰 、 紧 凑 ， 并 且 比 单个 数据 的 人 
替代 方案 更 灵活 。Body (程序 3.4.1 ) 是 一 个 Java 类 ,使 用 使 用 Vector 移动 小 球 
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Vector 实现 物体 移动 。 该 数据 类 型 的 实例 变量 为 两 个 Vector 对 象 (分 别 存储 物体 的 位 置 和 速 
度 )， 以 及 一 个 double 型 变量 (存储 质量 )。 数 据 类 型 的 操作 允许 客户 程序 移动 和 绘制 物体 
(以 及 计算 由 其 他 物体 引力 产生 的 力 ， 并 用 向 量 表示 这 个 力 )，Body 类 由 以 下 API 定义 : 


public class Body 
Body(Vector r, Vector v, double mass) 
void move(Vector f，double dt) ”给 对 象 施加 力 f， 移 动 对 象 dt 秒 
void draw() 绘制 物体 
Vector forceFrom(Body b) 这 个 物体 在 物体 b 上 的 外 力 向 量 


基于 牛顿 定律 的 多 体 移动 的 API ( 见 程序 3.4.1 ) 


从 技术 上 讲 ， 物 体 的 位 置 ( 距 原点 的 位 移 ) 不 是 一 个 向 量 〈 是 空间 中 的 一 个 点 ， 并 非 方 
向 和 大 小 )， 但 是 把 它 表 示 为 一 个 向 量 更 加 方便 ， 因 为 向 量 的 操作 使 移动 物体 的 代码 更 加 紧 
竣 ， 正 如 刚刚 讨论 的 那样 。 当 移动 物体 时 ， 不 仅 要 改变 物体 的 位 置 ， 还 需要 改变 其 速度 。 

力 与 运动 。 牛 顿 第 二 运动 定律 表明 ， 施 加 在 一 个 物体 (一 个 向 量 ) 上 的 力 等 于 它 的 质量 
(一 个 向 量 ) 和 它 的 加 速度 (也 是 一 个 向 量 ) 的 标量 积 : f=ma。 换 言 之 ,要 计算 物体 的 加 速 
度 ， 可 以 先 计 算 力 ， 然 后 用 力 除 以 物体 的 质量 。 


1 时刻 村 1 时 刻 


新 位 置 是 旧 位 置 
和 速度 的 问 量 和 









SC 
< 静止 的 物体 
We | 新 速度 是 旧 速 度 和 
大 小 是 力 /质量 加 速度 的 向 量 和 
者 
相对 于 静止 物体 的 移动 


在 Body 中 ， 力 是 方法 move() 的 一 个 参数 ， 其 类 型 为 Vector， 因 此 我 们 可 以 先 通 过 力 除 
以 质量 (存储 在 double 型 实例 变量 中 ) 来 计算 加 速度 向 量 ， 然 后 通过 速度 加 上 其 在 时 间 间 隔 
中 向 量 的 改变 值 来 计算 速度 的 变化 (计算 方法 与 使 用 速度 来 改变 位 置 的 方法 一 致 )。 这 个 法 
则 可 以 利用 如 下 代码 实现 ， 通 过 计算 给 定 力 向 量 f 和 时 间 间 隔 dt 来 更 新 物体 的 位 置 和 速度 : 


Vector a = f.scale(l1/mass); 
v= Vv.plus(a.scale(dt)); 


r= r.plus(v.scale(dt)); 单位 向 量 相互 作用 力 的 大 小 


G* aimass * b.mass 


这 段 代码 包 含 在 Body 的 move0 方法 中 , 用 于 调 | \ ts 
整 各 值 以 反映 该 力 在 时 间 间隔 内 作用 于 物体 的 结果 : 物 
体 移动 且 速度 改变 。 上 述 计算 假定 在 时 间 间 隔 内 加 束 
度 保持 不 变 。 

物体 之 间 的 作用 力 。Body 的 forceFrom() 中 封装 了 
一 个 物体 作用 于 另 一 个 物体 力 的 计算 ， 以 Body 对 象 作 
为 参数 ， 并 返回 一 个 Vector 类 型 。 牛 顿 的 万 有 引力 定律 上-_ 
是 计算 的 基础 ， 两 个 物体 之 间 的 引力 大 小 等 于 它们 质量 物体 之 间 的 作用 力 
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的 乘积 ， 除 以 它们 之 间距 离 的 平方 ， 再 乘 以 万 有 引力 常数 G (G 为 6.67X10 Nm”/kg ), 引力 
的 方向 是 两 个 物体 之 间 的 连 线 。 基 于 万 有 引力 定律 ， 计 算 a.forceFrom(b) 的 代码 如 下 所 示 : 


double G = 6.67e-11; 

Vector delta = b.r.minus(a.r); 

double dist = delta.magnitude(); 

double magnitude = (G * a.mass * b.mass) / (dist * dist); 
Vector force = delta.direction().scale(magnitude); 

return force; 


力 向 量 的 大 小 表示 为 magnitude， 是 一 个 浮 点 数 ， 力 向 量 的 方向 与 两 个 物体 位 置 向 量 差 


的 方向 相同 。 力 向 量 force 就 是 一 个 表示 其 方向 的 单位 向 量 扩展 了 magnitude 倍 。 









程序 3.4.1 引力 体 








public class Body 
‘ 


已 球 位置 

private Vector r; 有 
private Vector v; 速度 
mass | 质量 





private final double mass; 


public Body(Vector r0, Vector v0O, double m0) 
{ r= r0; v= v0; mass = m0; 


public void move(Vector force, double dt) force | 施加 在 物体 上 的 作用 力 





{ VW 更 新 位 置 和 速度 中 
Vector a = force.scale(l/mass); 起 ee 
v= Vv.plus(a.scale(dt)); Il 
r= r.plus(v.scale(dt)); 









a 这 个 物体 

public Vector forceFrom(Body b) b 另 一 个 物体 

{ 计算 b 施 加 在 物体 上 的 力 G -y 力 党 
Body a = this; 万 有 引 常量 
double :G_=:6;67e=ili delta -| 从 b 到 a 的 向 量 
Vector delta = b.r.minus(a.r); dist 从 b 到 a 的 距离 
double dist = delta.magnitude(); magnitude | 力 的 大 小 










double magnitude = (G * a.mass * b.mass) 

/ (dist * dist); 
Vector force = delta.direction() .scale(magnitude); 
return force; 






3 


public void drawO) 









StdDraw.setPenRadius (0.0125); 

StdDraw.point(r.cartesian(0), r.cartesian(1)); 
} 

} 





Body 数 据 类 型 提供 了 用 于 模拟 物理 实体 〈 如 行星 或 原子 粒子 ) 运动 所 需 
的 操作 。Body 是 可 变 类 型 ， 其 实例 变量 是 物体 的 位 置 和 速度 ， 通 过 move() 方 
法 响应 外 力作 用 而 改变 物体 的 位 置 和 速度 ( 物体 的 质量 不 可 变 ) 。forceFrom0 
方法 返回 一 个 力 向 量 。 







Universe 数据 类 型 。Universe (程序 3.4.2 ) 是 实现 以 下 API 的 数据 类 型 : 


public class Universe 
Universe(String filename) 根据 filename 初 始 化 Universe 
void increaseTime(double dt) ”模拟 dt 种 的 变化 


void drawO) 绘制 Universe 


Universe 类 型 的 API ( 见 程序 3.4.2 ) 
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Universe 数据 类 型 定义 了 一 个 宇宙 (其 大 小 、 天 体 的 数量 ， 以 及 一 个 天 体 数组 ) 以 及 两 
个 数据 类 型 操作 :increaseTime()， 用 于 调整 所 有 天 体 的 位 置 (以 及 速度 ) ; draw()， 用 于 绘制 
所 有 的 天 体 。 多 体 模拟 的 核心 是 实现 Universe 中 的 
increaseTime()。 计 算 的 第 一 部 分 是 计算 力 向 量 的 双 pp PE 
重 循 环 结 构 ， 力 向 量 描述 了 每 个 天 体 作用 于 男 一 个 5.oel0 
天 体 的 引力 。 程序 应 用 了 县 加 原理 ， 即将 作用 于 一 0.0e00 4.5el10 1.0e04 0.0e00 1.5e30 
个 天 体 的 力 向 量 逐 个 卷 加， 得 到 表示 所 有 力 的 单一 0.0e00 -4.5e10 -1.0e04 0.0e00 1.5e30 
向 量 。 在 计算 所 有 的 力 之 后 ， 程 序 调用 move0 来 为 re 
每 个 天 体 在 固定 的 时 间 间 隔 内 应 用 计算 得 到 的 力 。 1.25e11 

文件 格式 。 按 惯例 ， 我 们 采用 数据 驱动 的 设计 0.0e00 0.0e00 0.05e04 0.0e00 5.97e24 
方法 ， 从 一 个 文件 接收 输入 数据 。 构 造 画 数 从 一 个 0.0e00 -4 SC10 -3 0c04 0.0e00 1.989c30 
文件 中 读 取 Universe 参数 和 天 体 描述 ， 文 件 包 含 以 


% more 4body.txt 


下 信息 : Ee 速度 质量 
。 天 体 的 数量 。 [5.0s10]- 一 半径 | 
。 字 宙 的 半径 -3.5e10 0.0e00 0.0e00 | 1.4e03 [3.0e28 | 
9 -1.0e10 0.0e00|[0.0e00 1.4e04|3.0e28 
。 每 个 天 体 的 位 置 、 速 度 和 质量 。 1.0e10 0.0e00 0.0e00 -1.4e04 3.0e28 


像 往 常 一 样 ， 为 了 保持 一 致 性 ， 所 有 的 测量 |3.5e10 0.0e00|0.0e00 -1.4e03 3.0e28 
; > 
都 使 用 标准 国际 单位 (请 回顾 我 们 的 代码 中 出 现 位 置 
的 万 有 引力 常数 G)。 使 用 上 述 定义 的 文件 格式 ， Universe 文件 格式 示例 
Universe 构造 函数 的 代码 十 分 简单 。 


public Universe(String filename) 

{ 
In in = new In(filename); 
n = in.readInt(); 
radius = in.readDouble(); 
StdDraw.setXscale(-radius, +radius); 
StdDraw.setYscale(-radius, +radius); 


bodies = new Body[n]; 

for (inti =,07 < hy 

{ 
double rx = in.readDouble(); 
double ry = in.readDouble(0) ; 
double[] position = { rx, ry }; 
double vx = in.readDouble(); 
double vy = in.readDouble(Q); 
double[] velocity = { vx, vy }; 
double mass = in.readDouble(); 
Vector r = new Vector(position); 
Vector v = new Vector(velocity); 
bodies[i] = new Body(r, v, mass); 

} 

} 


每 个 天 体 都 由 5 个 浮 点 数 描述 : 天 体位 置 的 x 坐标 和 yy 坐标 、 天 体 初 始 速度 的 x 和 yy 分 
量 、 天 体 的 质量 。 

总 结 一 下 ， 我 们 在 Universe 的 测试 客户 程序 main() 中 实现 了 一 个 数据 驱动 程序 ， 模 拟 n 
个 天 体 在 相互 引力 作用 下 的 运动 轨迹 。 构 造 郴 数 创建 一 个 包含 对 个 Body 对 象 的 数组 ， 从 命令 
行 参数 指定 的 文件 中 读 取 每 个 天 体 的 初始 位 置 、 初 始 速度 和 质量 。 increaseTime() 计算 各 天 体 
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之 间 的 相互 作用 力 ， 并 基于 该 信息 在 时 间 间 隔 dt 之 后 更 新 每 个 天 体 的 加 速度 、 速 度 和 位 置 。 
main() 测试 程序 调用 构造 函数 ， 然 后 循环 调用 increaseTime() 和 draw() 来 模拟 天 体 的 运动 。 

















程序 3.4.2 ”多 体 模拟 






public class Universe 


sg 
private final double radius; dius 宇宙 的 半径 
private final int n; n 天 体 的 数量 
private final Body[] bodies; bodies[] | 多 体 数 组 


public void increaseTime(double dt) 


Vector[] f = new Vector[n]; 
for (int i =0; i < ni i++) 

f[i] = new Vector(new double[2]1); 3 
for (int i = 0; 1 < n; i++) 

for Cint j = 0; j hn j++) 

if Cisl= 河 ) 
f[i] = f[i].plus(bodies[i].forceFrom(Cbodies[]j])7); 

for (Cint 1 = 0; 1 < ni i++) 

bodies[i] .move(f[i], dt); 


public void drawO) 
{ % java Universe 3body.txt 20000 
880 steps 


for Cint 1 = 0; i < ni i++) 
bodies[i] .drawO); 
} 


public static void main(String[] args) 



















Universe newton = new Universe(args[0]); 
double dt = Double.parseDouble(args[1]); 
StdDraw.enableDoubleBuffering(); 

while (true) 





StdDraw.clearQO; 
newton. increaseTime (dt); 
newton .draw() ; 
StdDraw. show(); 
StdDraw.pause(20); 








这 是 一 个 数据 驱动 的 程序 ， 第 一 个 命令 行 参数 指定 了 文件 ， 其 中 的 数据 定义 
了 Universe 的 信息 ， 本 程序 用 于 模拟 这 个 字 宙 中 天 体 的 运动 ， 第 二 个 命令 行 参 数 
为 递增 时 间 间 隔 。 读 者 可 以 参阅 相关 正文 内 容 以 了 解构 造 函 数 的 实现 。 


可 以 在 本 书 官网 中 找到 许多 定义 各 种 “宇宙 ”的 文件 ,我 们 鼓励 你 运行 这 些 程序 以 观察 
它们 的 运动 轨迹 。 当 观察 到 这 些 运动 轨迹 的 时 候 你 就 会 明白 , 为 什么 牛顿 难以 推导 出 定义 天 
体 运行 的 轨道 公式 ， 即 使 是 少量 天 体 也 很 难 。 以 下 结果 图 说 明了 前 面 给 出 的 数据 文件 中 二 
体 、 三 体 和 四 体 实例 运行 Universe 的 轨迹 。 二 体 宇宙 是 一 对 相互 环绕 的 轨道 对 ， 三 体 宇宙 
是 一 颗 卫 星 在 两 颗 行 星 轨 道上 跳跃 的 混乱 情况 。 四 体 宇宙 则 是 一 个 相对 简单 的 情况 ， 是 两 对 
缓慢 旋转 的 相互 环绕 的 天 体 对 。 这 些 静 态 图 像 采 用 了 BouncingBall (程序 3.1.9) 中 类 似 的 方 
法 ， 即 修改 Universe 和 Body， 在 灰色 的 背景 上 交替 使 用 白色 和 黑色 绘制 天 体 。 运 行 
Universal 时 得 到 的 动态 图 像 可 以 显示 天 体 环 绕 的 真实 场景 ， 这 通过 固定 的 图 片 很 难 辨别 。 
如 果 基 于 大 量 的 天 体 来 运行 Universe， 读 者 就 可 以 理解 为 什么 模拟 对 于 试图 理解 复杂 问题 的 
科学 家 来 说 是 一 个 如 此 重要 的 工具 了 。 多 体 模 拟 模型 是 非常 通用 的 ， 通 过 尝试 不 同 的 输入 文 
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件 ， 读 者 会 充分 体会 到 这 一 点 。 
读者 可 能 想 要 设计 自己 的 Universe ( 见 练习 pe Fi 
3.4.7 )。 创 建 一 个 数据 文件 的 最 大 挑战 是 适当 地 缩 2 
放 数 值 ， 以 利用 宇宙 的 半径 、 时 间 尺 度 、 天 体质 量 5.0e10 
和 速度 来 产生 有 趣 的 行为 。 读 者 可 以 研究 行星 围绕 ”0 .0000 .4.5610 了 .0504 0.0500 1 5c30 
便 星 旋转 的 轨迹 ， 或 者 亚 原子 粒子 间 的 相互 作用 ， jp 友子 是 有 
但 是 可 能 无 法 研究 行星 与 亚 原子 粒子 间 的 相互 作 。% nore 2bodyriny_ txt 
用 。 当 使 用 自己 创建 的 数据 时 ， 很 可 能 会 出 现 一 些 2 
天 体 飞 到 无 穷 远 处 、 一 些 会 被 吸引 进入 其 他 天 体 的 FR 4.5e-10 1,0e-16 0.0e00 1.5e-30 


情况 ， 但 是 请 欣赏 这 些 情形 吧 ! 0.0e00 -4.5e-10 -1.0e-16 0.0e00 1.5e-30 


100 步 150 步 100 步 







1000 步 1600 步 





10 000 步 3100 步 
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我 们 提供 这 个 案例 的 目的 是 阐述 数据 类 型 的 效用 ， 而 不 是 提供 用 于 实际 用 途 的 多 体 模拟 
代码 。 当 使 用 这 种 方法 研究 自然 现象 时 ， 科 学 家 有 许多 难题 需要 处 理 。 第 一 个 是 数值 精度 : 
在 模拟 过 程 中 ， 常 常会 因为 累积 计算 误差 导致 模拟 产生 奇怪 的 结果 ， 这 在 自然 界 中 是 不 会 发 
生 的 。 例 如 ， 当 天 体 (几乎 ) 相互 碰撞 时 ， 我 们 的 代码 不 会 采取 特殊 的 行动 。 第 三 个 是 效率 : 


491 
《 
492 
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Universe 中 的 move() 方法 执行 的 时 间 与 到 成 正比 ， 所 以 不 适用 于 模拟 大 量 的 天 体 。 与 基因 
组 学 一 样 ， 要 解决 与 多 体 相关 的 科学 问题 ， 不 仅 需 要 涉及 原始 问题 领域 的 知识 ， 还 需要 涉及 
一 些 计 算 机 科学 家 早期 就 开始 研究 的 核心 计算 问题 。 

为 了 简单 起 见 ， 我 们 研究 的 是 一 个 二 维 宇宙 空间 ， 只 有 天 体 在 一 个 平面 上 运动 时 ， 三 维 
宇宙 才 有 现实 意义 。 但 是 ， 基 于 Vector 实现 的 Body 意味 着 ,无 须 修改 太 多 代码 ， 一 个 客户 
端 就 可 以 使 用 三 维 向 量 来 模拟 三 维 空间 (实际 上 是 任意 数量 的 维度 ) 中 球体 的 运动 轨迹 ! 对 
于 三 维 宇 害 ，draw() 方法 可 以 将 球体 位 置 投影 到 由 前 两 个 维度 定义 的 平面 上 。 

Universe 中 的 测试 客户 程序 只 是 一 种 可 能 性 ， 我 们 可 以 在 其 他 各 种 情况 下 使 用 相同 的 基 
本 模型 (例如 ， 在 天 体 间 包含 不 同类 型 的 相互 作用 力 )。 一 种 可 能 的 应 用 场景 是 观察 和 测量 
一 些 现 有 天 体 的 当前 运动 ,然后 逆向 运行 模拟 ! 这 是 天 体 物 理学 家 试图 了 解 宇宙 起 源 的 一 种 
方法 。 在 科学 研究 中 ， 我 们 试图 了 解 事物 的 过 去 和 预测 事物 的 未 来 。 通 过 一 个 良好 的 模拟 ， 
我 们 可 以 同时 实现 这 两 个 目的 。 
问答 环节 

问 : Universe 的 API 规模 比 较 小 。 为 什么 不 在 Body 的 测试 客户 程序 main() 中 实现 这 些 
代码 ? 

答 : 我 们 的 设计 理念 是 大 多 数 人 对 宇宙 i 认 知 的 一 个 表达 : 宇宙 被 创造 ， 并 随时 间 而 运动 。 
这 种 设计 方法 可 以 使 代码 更 加 清晰 ， 同 时 也 能 提供 最 大 的 灵活 性 来 模拟 宇宙 是 如 何 运 行 的 。 

问 : 为 什么 forceFrom() 是 一 个 实例 方法 ? 它 被 实现 为 采用 两 个 Body 对 象 作为 参数 的 
函数 是 否 更 加 恰当 ? 

答 : 是 的 ，forceFrom0 的 实例 方法 实现 有 几 种 可 能 的 替代 方法 ， 其 中 之 一 是 静态 方法 ， 包 
含 两 个 Body 对 象 作为 参数 是 合理 的 选择 。 一 些 程序 员 倾 向 于 在 数据 类 型 实现 中 避免 使 用 静态 函 
数 。 另 一 种 选择 是 将 作用 于 每 个 Body 对 象 的 力作 为 一 个 实例 变量 。 我 们 的 选择 是 两 者 的 折 中 。 


练习 


3.4.1 开发 BouncingBall (程序 3.1.9 ) 的 一 个 面向 对 象 的 版 本 。 程 序 包 括 : 一 个 构造 函数 ， 用 于 初始 
化 每 个 小 球 的 运动 (随机 方向 和 随机 速度 ， 在 合理 的 范围 内 ) ; 一 个 测试 客户 程序 ， 从 命令 行 接 
收 一 个 整数 参数 n， 模 拟 n 个 弹跳 小 球 。 

3.4.2 ”请 在 程序 3.4.1 中 添加 main() 方法 ， 对 Body 数据 类 型 对 象 进行 单元 测试 。 

3.4.3 ”修改 Body (程序 3.4.1 )， 实 现 绘制 的 圆 (对 应 于 天 体 ) 半径 与 其 质量 成 正比 。 

3.4.4 ”请 问 在 一 个 没有 引力 的 宇宙 中 会 发 生 什 么 ?这 种 情况 对 应 于 Body 中 的 forceTo( 总 是 返回 零 向 量 。 

3.4.5 ”请 创建 一 个 数据 类 型 Universe3D 以 模拟 三 维 宇 宙 。 开 发 一 个 数据 文件 用 于 模拟 太阳 系 中 行星 围 
绕 太 阳 旋 转 的 运动 轨迹 。 

3.4.6 ”请 编写 一 个 RandomBody 类 ,使 用 (精心 选择 的 ) 随机 值 代替 参数 初始 化 其 实例 变量 。 然 后 编写 一 
个 客户 程序 ， 从 命令 行 接收 一 个 整数 参数 n， 模 拟 一 个 包含 n 个 天 体 的 字 宙 中 天 体 随机 运动 的 轨迹 。 


创新 练习 


3.4.7 新 宇宙 。 请 使 用 有 趣 的 属性 设计 一 个 新 宇宙 ， 并 使 用 Universe 模拟 其 运动 轨迹 。 这 个 练习 是 一 
个 锻炼 创造 性 的 好 机 会 ! 

3.4:8 渗透 原理 。 请 开发 Percolation (程序 2.4.5 ) 的 一 个 面向 对 象 版 本 。 程 序 编写 之 前 请 仔细 考虑 设 
计 方 案 ， 并 证 明 该 设计 方案 的 正确 性 。 
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本 章 讨论 基本 数据 类 型 ， 它 们 是 应 用 程序 的 基本 构件 。 无 论 读者 选择 使 用 Java 库 实现 ， 
还 是 根据 本 章 给 定 的 代码 开发 自 定义 类 型 ， 在 本 章 你 都 会 学 到 如 何 用 好 这 些 数据 类 型 。 

对 象 可 以 包含 指向 其 他 对 象 的 引用 ， 所 以 我 们 构建 了 链接 结构 ， 这 个 数据 结构 可 能 会 非 
常 复杂 。 基 于 链接 结构 和 数组 ， 我 们 可 以 构建 数据 结构 来 组 织 信息 ， 以 便 使 用 相关 算法 高 效 
处 理 数据 。 在 一 个 数据 类 型 中 ,我 们 使 用 一 系列 值 来 构建 数据 结构 ， 使 用 方法 操作 这 些 值 来 
实现 算法 。 

本 章 讨论 的 算法 和 数据 结构 知识 是 过 去 50 年 来 形成 的 知识 体系 ， 它 们 构成 了 在 各 种 各 
样 的 应 用 中 有 效 使 用 计算 机 的 基础 。 从 物理 学 上 的 多 体 模拟 问题 到 生物 信息 学 中 的 遗传 序列 
问题 ， 从 数据 库 系统 到 搜索 引擎 ， 这 些 方法 都 是 商业 计算 的 基础 。 随 着 计算 应 用 程序 范围 的 
不 断 扩大 ， 这 些 基本 方法 的 影响 也 在 不 断 增 长 。 

算法 和 数据 结构 本 身 也 是 科学 研究 的 对 象 。 因 此 ， 我们 首先 讨论 分 析 算 法 性 能 的 科学 方 
法 ,然后 在 本 章 的 后 续 章 节 中 ， 我 们 会 使 用 这 种 方法 来 研究 算法 的 性 能 。 


4.1 性 能 


在 本 节 中 ， 我们 将 反复 强调 在 编写 任何 程序 时 都 必须 遵守 的 一 个 原则 ， 该 原则 可 以 简洁 
地 表述 为 一 个 设计 理念 : 关注 成 本 。 如 果 你 是 一 位 工程 师 ， 那 么 节省 成 本 就 是 你 的 工作 ; 如 
果 你 是 一 个 生物 学 家 或 物理 学 家 ， 成 本 将 决定 你 可 以 解决 哪些 科学 问题 ; 如 果 你 从 事 商 务工 
作 或 是 一 位 经 济 学 家 ， 那 么 节约 成 本 是 毋庸 置疑 的 ; 如 果 你 是 一 名 软件 开发 人 员 ， 成 本 将 决 
定 你 构建 的 软件 是 否 对 客户 有 用 。 

为 了 研究 软件 的 运行 成 本 ， 我 们 通过 科学 方法 〈 也 就 是 科学 家 普遍 接受 和 使 用 ， 以 
研究 自然 世界 知识 的 技术 ) 来 研究 程序 。 我 们 还 将 使 用 数学 分 析 来 推导 出 有 关 成 本 的 简洁 
模型 。 

我 们 在 研究 自然 界 的 哪些 特征 ?在 大 多 数 情 况 下 ,我们 对 其 中 一 个 基本 特征 感 兴趣 : 时 
间 。 每 当 运行 一 个 程序 时 ， 都 执行 了 一 次 涉及 自然 界 的 实验 ， 一 个 复杂 的 电子 电路 系统 通过 
一 系列 的 状态 改变 ,处理 大 量 的 离散 事件 并 最 终 停留 在 一 种 稳定 状态 ， 以 表示 我 们 期 望 的 结 
果 。 虽 然 开 发 Java 程序 是 在 抽象 世界 中 进行 的 ， 但 这 些 事情 肯定 会 在 自然 界 发 生 。 从 开始 
到 我 们 能 够 看 见 结果 一 共 会 经 过 多 少时 间 ? 对 于 我 们 而 言 ， 时 间 的 长 短 (毫秒 、 秒 、 天 还 是 
星期 ) 十 分 关键 。 因 此 ， 我们 需要 利用 科学 的 方法 来 掌握 如 何 合理 控制 这 些 状况 ， 就 像 发 射 
火箭 、 建 造 桥梁 或 是 粉碎 原子 一 样 。 

一 方面 ， 现 代 程 序 和 编程 环境 十 分 复杂 ; 另 一 方面 ， 它 们 提供 了 一 套 简单 〈 但 功能 强大 ) 
的 抽象 集 以 用 于 程序 开发 ， 每 次 运行 程序 都 可 以 产生 相同 的 结果 。 不 能 不 说 这 是 一 个 小 小 的 
奇迹 。 为 了 估算 程序 运行 所 需 的 时 间 ， 我 们 利用 了 构建 程序 的 支撑 架构 。 你 可 能 想象 不 到 编 
写成 本 开销 估计 和 性 能 预测 的 程序 的 简单 程度 。 

科学 方法 。 以 下 五 个 步骤 简要 总 结 了 我 们 采用 的 科学 方法 : 
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。 观察 自然 界 的 一 些 特征 。 

。 假设 一 个 与 观测 结果 一 致 的 模型 。 

。 使 用 该 假设 的 模型 预测 事件 。 

。 通过 进一步 的 观察 来 验证 预测 。 

。 通过 重复 验证 ， 直 到 确认 假设 和 观察 结果 一 致 。 

科学 方法 的 一 个 关键 原则 是 ， 我 们 设计 的 实验 必须 是 可 重复 的 ， 以 便 其 他 人 可 以 证 明 假 
说 的 有 效 性 。 此 外 ， 我 们 制定 的 假设 必须 可 以 被 证 伪 ， 即 可 以 确定 一 个 假设 错误 的 概率 ( 因 
此 需要 修正 )。 

观察 ”我 们 面临 的 第 一 个 挑战 是 对 程序 的 运行 时 间 进 ”java WhreeSum < 2Kints.txt 
行 定 量 测 量 。 虽 然 精确 测量 程序 的 运行 时 间 十 分 困难 ， 但 通 et 
常 近似 值 就 可 以 满足 要 求 。 有 很 多 工具 可 以 帮助 我 们 获得 
这 种 近似 值 。 其 中 最 简单 的 方法 是 使 用 一 块 物理 秒表 或 使 用 0。 
Stopwatch 数据 类 型 ( 见 程序 3.2.2 )。 我 们 可 以 通过 不 同 的 输 22 ee" 2S 
入 来 运行 一 个 程序 ， 从 而 测量 程序 处 理 不 同 输入 所 需 的 时 间 。 四 elninon 

在 对 程序 做 定性 观察 时 ， 面 临 的 第 一 个 问题 是 如 何 刻画 。 “< toricewic vic tict ni 
问题 规模 ， 问 题 的 规模 决定 了 完成 计算 任务 的 难度 。 通 常 ， 391930676 -763182495 371251819 
决定 问题 规模 的 是 输入 数据 的 大 小 或 命令 行 参数 值 。 直 观 上 ， -326747290 802431422 -475684132 
运行 时 间 应 该 随 着 问题 规模 的 增加 而 增加 ， 但 是 问题 是 每 次 观察 一 个 程序 的 运行 时 间 
开发 和 运行 不 同 的 程序 时 ， 运 行 时 间 到 底 增加 了 多 少 。 

许多 程序 面临 的 另 一 个 问题 是 程序 运行 时 间 与 输入 本 身 关系 不 大 ， 而 主要 取决 于 问题 规 
模 的 大 小 。 如 果 不 存 在 这 种 关系 ， 则 需要 进行 更 多 的 实验 以 更 好 地 理解 输入 对 运行 时 间 的 影 
响 。 由 于 这 种 关系 常常 存在 ， 因 此 我 们 现在 关注 的 目标 是 更 好 地 量化 问题 规模 和 运行 时 间 的 
对 应 关系 。 

作为 一 个 具体 的 实例 ， 我 们 从 研究 ThreeSum (程序 4.1.1 ) 开始 ， 该 程序 用 于 计算 nn 个 
元 素 的 数组 中 总 和 为 0 的 〈 无 序 ) 三 元 组 数量 (假设 不 存在 整数 溢出 )。 这 个 计算 可 能 对 读者 
来 说 很 勉强 ， 但 实际 上 它 与 许多 基本 的 计算 任务 密切 相关 ， 特 别 是 计算 几何 中 的 一 些 计算 任 
务 ， 因 而 该 问题 值得 仔细 研究 。 在 ThreeSum 的 问题 规模 n 和 运行 时 间 之 间 ， 究 竞 存 在 什么 
关系 ? 

假设 “在 计算 机 科学 的 早期 ， 唐纳德- 克 努 特 ( Donald Knuth) 证 明了 如 下 观点 : 尽管 
在 理解 程序 运行 时 间 上 存在 各 种 复杂 的 因素 ,但 从 原则 上 而 言 ， 可 以 构建 一 个 准确 的 模型 来 
帮助 我 们 精确 地 预测 程序 的 运行 时 间 。 对 这 类 问题 的 正确 分 析 涉 及 如 下 内 容 : 

。 透彻 理解 程序 。 

。 透彻 理解 系统 和 计算 机 。 

。 数学 分 析 的 高 级 工具 。 

因此 ， 这 个 问题 最 好 留 给 专家 。 然 而 ， 每 个 程序 员 都 需要 知道 如 何 做 出 粗略 的 性 能 估 
计 。 幸 运 的 是 ， 通 过 使 用 经 验 观 察 和 一 小 部 分 数学 工具 的 组 合 就 可 以 获取 这 些 知 识 。 

倍增 假设 。 对 于 许多 程序 ， 我们 可 以 基于 如 下 问题 建立 一 个 假设 : 如 果 输 入 规模 加 倍 ， 
对 程序 的 运行 时 间 有 什么 影响 ? 为 了 简洁 起 见 ， 我 们 称 这 个 假说 为 倍增 假设 。 也 许 关 注 成 本 
最 简单 的 方法 是 程序 开发 过 程 和 实际 应 用 中 不 断 询问 自己 这 个 问题 。 接 下 来 ， 我 们 将 讨论 如 
何 通过 应 用 科学 方法 解答 这 个 问题 。 


程序 4.1.1 三 数 求 和 问题 


public class ThreeSum 


public static void printTriplesCint[] a) 
{ /* 参 见 练习 4.1.1*/ } 

public static int countTriples(int[] a) 
{ /W 计算 和 为 0 的 三 元 组 


int n = a.length; 
int count = 0; 
for (Cint 1 = 0; i < ni i++) 
for Gnt jesjhl;3 -< Nn jt 
for (Cint k = j+1; k < ni k++) 
if (a[i] + a[j] + a[k] == 0) 
Count++; 
return count; 


public static void main(String[] args) 
{ 


int[] a = StdIn.readAllIntsO:; 
int count = countTriples(a); 
StdOut.printlin(count); 
if (count < 10) printTriples(a); 
} 
} 
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countTriples() 方 法 计算 a[] 中 三 个 数 的 总 和 正好 为 0 的 三 元 组 (忽略 整数 溢 
出 ) 。 测 试 客户 程序 从 标准 输入 读 取 一 个 整数 数组 ， 调 用 countTriples()， 如 果 
个 数 比 较 少 ， 则 同时 输出 满足 条 件 的 三 元 组 。 文 件 1Kints:txt 包 含 1024 个 随机 整 
数值 。 这 个 文件 不 太 可 能 包含 这 样 的 三 元 组 (参见 练习 4.1.28 ) 。 


% more 8ints.txt 


% java ThreeSum < 8ints.txt 
4 


30 

-30 30 -30 0 

-20 30 -20 -10 

-10 -30 -10 40 

40 -10 0 10 
0 

10 % java ThreeSum < 1LKints .txt 
5 0 


实证 分 析 。 显 然 ， 我 们 可 以 通过 将 输入 规模 加 倍 ， 并 观察 其 对 运行 时 间 的 影响 ， 来 得 
到 一 个 2 倍 的 倍增 假设 的 答案 。 例如 ，DoublingTest (程序 4.1.2 ) 为 ThreeSum 生成 一 系列 
随机 输入 数组 ， 每 一 步 数组 长 度 加 倍 ， 然 后 输出 ThreeSum.countTriples() 的 运行 时 间 相 对 


于 上 一 次 运行 时 间 (前 一 次 输入 的 大 小 是 当前 输入 大 
小 的 一 半 ) 的 比值 。 如 果 运 行 这 个 程序 ， 你 将 发 现 自 
己 陷 入 了 一 种 “预测 - 验证 ”循环 : 开始 几 行 的 输出 
速度 很 快 , 但 随后 开始 变 慢 。 每 次 输出 一 行内 容 ， 你 
将 发 现 自己 总 会 思考 这 个 问题 : 输出 下 一 行 的 内 容 需 
要 多 长 时 间 ? 如 果 程 序 运 行 时 使 用 Stopwatch 执行 测 
量 ,很 容易 预测 每 一 行 的 间隔 时 间 按 8 的 倍数 增加 。 
因而 可 以 直接 推导 出 一 种 假设 : 当 输 入 的 大 小 加 倍 
时 ,运行 时 间 按 8 的 倍数 增加 。 我 们 也 可 以 绘制 运行 
时 间 图 ， 从 标准 曲线 图 ( 右 图 ) 可 以 看 出 运行 时 间 随 
着 输入 规模 的 增加 而 增加 的 比例 。 也 可 以 基于 对 数 图 


时 间 
| 


512T 


256T 


128T 
64T 


1K 2K 4K 8K 
标准 曲线 图 


规模 一 


290 铬 了 淖 


来 绘制 。 针 对 ThreeSum 程序 ， 其 对 数 图 (下 图 ) 是 斜率 为 3 的 直线 ， 该 直线 充分 地 表明 运 
行 时间 满 足 形 如 cm? 的 乘 紧 定 律 的 假设 ( 见 练习 4.1.6 )。 时 间 
数学 分 析 。Knuth 提出 的 通过 构建 数学 模型 来 描述 程序 运 


1024T 
行 时 间 的 见解 十 分 简单 ， 即 程序 的 总 时 间 取 决 于 以 下 两 个 主要 。 or 
因素 : 
。 每 条 语句 的 执行 时 间 成 本 。 
。 每 条 语句 的 执行 频率 。 A 


第 一 个 因素 是 系统 属性 ， 第 二 个 因素 是 算法 属性 。 如 果 我 们 
了 解 程序 中 所 有 指令 的 这 两 种 属性 ， 那 么 可 以 通过 将 属性 相 乘 并 
加 上 程序 中 所 有 指令 的 执行 时 间 ， 来 获得 程序 的 运行 时 间 成 本 。 和 
其 中 最 大 的 挑战 是 确定 语句 的 执行 频率 。 有 些 语句 比较 容 hr 
易 分 析 ， 如 ThreeSum.countTriples() 中 初始 化 count 为 0 的 语句 34 
只 执行 一 次 。 其 他 语句 则 需要 更 高 层次 的 推理 ， 如 ThreeSum. 入 
countTriples() 中 的 让 语句 精确 地 执行 了 n(n-1)(n-2)/6 次 (这 
正 是 从 输入 数组 中 挑选 三 个 不 同 数 的 方法 的 数量 一 一 参见 练习 ”规模 一 1K 2K 4K 8K 
4.1.4)。 国宝 
















程序 4.1.2 ”验证 倍增 假设 


public class DoublingTest 
public static double timeTrial(int n) 
{ // 计算 解决 问题 的 时 间 ， 问 题 的 输入 大 小 为 n 
int[] a = new int[n]; 
for (int i = 0; -<On; 14+) 
a[i] = StdRandom.uniform(2000000) - 1000000; 
Stopwatch timer = new Stopwatch(); 
int count = ThreeSum.countTriples(a); n 
return timer.elapsedTime(); ar] 











问题 规模 
随机 整数 





} 
public static void main(String[] args) 


{ -/ 输出 倍增 比例 列表 
for,(int mn a S12;- trues Nn *= 2) 
{ /1 输出 问题 规模 为 n 的 倍增 比例 


double previous = timeTrial(n/2); 









double current = timeTrial(n); n 问题 规模 

double ratio = current / previous; previous | n/2 的 运行 时 间 

StdOut .printf("%7d %4.2f\n"，n，ratio); current | n 的 运行 时 间 
; ratio | 运行 时 间 比例 





该 程序 向 标准 输出 写 入 三 数 求 和 问题 的 倍增 比例 列表 2 列表 显示 了 倍增 
问题 规模 对 函数 调用 ThreeSum.countTriples0 的 运行 时 间 的 影响 ， 问 题 规模 初 
始 为 5S12， 列 表 中 每 一 行 表示 的 问题 规模 都 比 上 一 行 加 倍 。 这 些 实验 可 以 推导 
出 一 个 假设 ， 即 当 输 入 规模 加 倍 时 :运行 时 间 按 8 的 倍数 递增 。 运 行程 序 时 ， 
请 注意 观察 每 行内 容 输 出 的 时 间 间 隔 按 8 的 倍数 递增 ， 从 而 验证 该 假设 。 













% java DoublingTest 
512 6.48 
1024 8.30 
2048 7.75 
4096 8.00 

8192 8.05 
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public class ThreeSum 


public static int count(Cint[] a) 
No 
int count = 0; + 一 1 
for (int 1 = 0; i < n; i++) 
For Cmte = T1417 < TT T+) 
for Cint k= j+1l; k < ny k++y 





内 层 循环 





if (a[i] + a[j + a[lk] == 0) 


COUNt++; 














return count; 依赖 输入 数据 





} 
public static void main(String[] args) 
{ 

int[] a = StdIn.readAllInts(); 


int count = count(a); 
StdOut.printin(count); 


程序 语句 执行 频率 的 分 析 


这 种 类 型 的 频率 分 析 可 能 导致 复杂 和 宛 长 的 数学 表达 式 。 为 了 显著 地 简化 数学 分 析 中 的 
问题 ， 我 们 建立 了 两 种 更 简单 的 近似 表达 式 。 

首先 ， 我 们 使 用 称 为 波浪 线 表示 法 的 数学 方法 来 处 
理 数学 表达 式 的 首 项 。 我 们 使 用 记号 ~ftn) 表示 当 nn 增 
大 时 ， 除 以 jz) 后 趋 于 1 的 任意 量 。 同 样 我 们 使 用 记号 
g(n)~ftn) 表示 当 nn 增 加 时 ，g(n)/ftn) 趋 于 1。 使 用 这 种 
记 法 ,我们 可 以 忽略 一 个 表达 式 中 代表 较 小 值 的 复杂 部 
分 。 例 如 ，ThreeSum 中 的 证 语句 被 执行 ~n3/6 次 ， 因 为 
n(n-1)(n-2)/6=n3/6-n?/2+n/3， 如 果 除 以 n3/6， 则 当 n 增 大 
时 ;结果 趋 于 1。 这 种 记 法 适用 于 首 项 之 后 的 项 相对 来 说 
不 太 重 要 的 情况 (例如 ， 当 n=1000 时 ， 这 个 假设 是 指 与 
mm/6 守 166666667 相 比 ，-n”/2+n/3 守 -499667 是 微不足道 的 ， 结 果 正 是 如 此 )。 

其 次 ， 我 们 关注 最 经 常 执行 的 指令 ， 有 时 是 指 程序 最 里 层 的 循环 。 在 这 个 程序 中 ， 我 们 
可 以 合理 地 假设 内 层 循环 外 的 指令 消耗 的 时 间 相对 较 少 。 

分 析 一 个 程序 的 运行 时 间 的 关键 点 在 于 ， 对 于 大 多 数 程序 ， 运 行 时 间 满 足 如 下 关系 式 : 

T(n)~cfln) 

其 中 c 是 一 个 常数 ，ftn) 是 一 个 函数 ， 称 为 运行 时 间 的 增长 量 级 。 对 于 典型 的 程序 ，ftn) 是 
类 似 于 logn、n、n logn、m、n 的 函数 ,我们 接 下 来 将 接触 到 这 些 函 数 (通常 表述 增长 量 级 
函数 时 忽略 其 常数 系数 )。 当 ftn) 是 n 的 乘 究 时 (大 多 数 情 况 )， 这 个 假设 等 效 于 运行 时 间 满 
足 乘 军 定 律 。 以 ThreeSum 为 例 ， 该 假设 已 被 我 们 的 经 验 观察 验证 : ThreeSum 运行 时 间 的 
增长 量 级 为 好 。 常 数 ec 的 值 取 决 于 执行 语句 的 时 间 成 本 和 频率 分 析 的 细节 ， 但 是 一 般 我 们 不 
需要 考虑 这 个 常量 值 ， 稍 后 将 说 明理 由 。 

增长 量 级 是 一 个 关于 运行 时 间 的 简单 而 强大 的 模型 。 例 如 ， 根 据 增长 量 级 能 够 自然 而 然 
地 引出 倍增 假设 。 以 ThreeSum 为 例 ， 已 知 增长 量 级 为 妈 ， 表 明 当 问题 规模 翻 倍 时 ”可 以 估 
计 运 行 时 间 将 增加 8 倍 ， 因 为 







166 666 667 n(n—1)(n-2)/6 


166 167 000 


1000 
首 项 近似 


T(2n)/T(n)=c(2n)/cn3=8 
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计算 结果 与 经 验 分 析 的 结果 一 致 ， 从 而 同时 验证 了 模型 和 实验 结果 。 请 仔细 研究 此 示 
例 ， 因 为 可 以 使 用 相同 的 方法 更 好 地 理解 你 所 编写 的 任何 一 个 程序 的 性 能 。 

Knuth 证 明了 可 以 为 任何 一 个 程序 的 运行 时 间 建 立 一 个 精确 的 数学 模型 ， 并 且 许多 专家 
花费 了 大 量 时间 开 发 这 类 模型 。 但 是 理解 一 个 程序 的 性 能 并 不 需要 这 样 详细 的 模型 : 在 运行 
时 间 估 计 中 ， 忽 略 内 层 循环 以 外 指令 的 运行 时 间 成 本 通常 是 安全 的 (因为 与 内 层 循环 中 指令 
的 时 间 成 本 相 比 ， 其 运行 成 本 可 以 忽略 不 计 )， 且 不 必 知 道 近似 公式 中 常数 的 值 (因为 使 用 
倍增 假说 进行 预测 时 ， 常 量 的 作用 将 被 抵消 )。 








指 人 数量 。。。 ti 模仿 鸣 扣 全。 指令 执行 频 素 总 时 间 
6 2x102 12/6-72/2+Hm13 (27B-672 十 47)x107 
4 3x107 m/2-n/2 (6 十 的 )x107 
4 3x10” n (12n)x10™ 
10 1x10™ 1 10x10” 
全 部 时 间 (273+227 十 10)x1023 
波浪 符 ~2mx10® 
增长 量 级 m 


分 析 程 序 的 运行 时 间 (示例 ) 


这 些 近 似 使 得 具体 使 用 的 机 器 的 特性 在 模型 中 不 再 起 到 重要 作用 一 一 这 种 分 析 方 法 把 算 
法 从 系统 中 分 离开 。ThreeSum 程序 运行 时 间 的 增长 量 级 为 ww” ， 并且 不 依赖 于 是 在 Java 还 是 
在 Python 中 实现 的 ， 也 不 依赖 于 是 在 笔记 本 电脑 、 手 机 ,还 是 在 超级 计算 机 上 运行 的 。 其 
主要 取决 于 程序 检测 所 有 的 三 元 组 的 功能 。 计 算 机 和 系统 的 属性 均 体 现在 程序 语句 和 机 器 指 
令 的 关系 上 ， 表 现 为 我 们 观测 到 的 程序 的 实际 运行 时 间 ,， 这 些 都 是 倍增 假设 的 基础 。 我 们 使 
用 的 算法 决定 了 增长 的 量 级 。 这 种 分 离 的 思想 是 一 种 强大 的 概念 ， 因 为 它 允 许 我 们 形成 关于 
算法 性 能 的 知识 ， 然 后 把 这 些 知识 应 用 到 任何 计算 机 上 。 事 实 上 ， 大 多 数 经 典 算法 性 能 的 研 
究 在 几 十 年 前 已 经 完成 ， 但 这 些 知 识 仍 与 当今 的 计算 机 息息相关 。 

上 述 经 验 和 数学 分 析 构 成 了 一 个 模型 ， 可 以 通过 列 出 所 有 相关 的 假设 〈 例 如 ， 每 条 指令 每 


次 执行 时 消耗 同样 的 时 间 、 运 行 环境 总 是 一 致 的 等 ) 增长 量 级 
为 参数 ， 实 现 对 程序 执行 过 程 的 形式 化 分 析 。 大 多 数 描述 函数 : “倍增 假设 的 倍数 





程序 并 不 值得 详细 建 模 ， 但 是 读者 应 该 了 解 自己 编写 常量 
的 每 个 程序 的 期 望 运行 时 间 。 一 定 要 注意 程序 的 开 


销 。 信 增 假设 是 一 个 很 实用 的 分 析 方 法 ， 你 可 以 通过 。 。 允 数 2 
实验 分 析 ， 也 可 以 使 用 数学 分 析 ， 当 然 最 好 是 两 者 结 。 改作 
合 。 关 于 性 能 的 信息 非常 重要 ， 你 会 很 快 习惯 于 每 次 

运行 一 个 程序 时 先 对 性 能 有 一 个 假设 估算 ; 然后 用 人 时 "8 有 
运行 结果 验证 你 的 假设 。 事 实 上 ， 当 你 等 竺 程序 运 。 ” = 次 ~ 


行 结束 时 ， 进 行 这 项 工作 是 对 时 间 的 充分 利用 ! 
增长 量 级 分 类 ”我 们 仅仅 使 用 若干 结构 化 原 语 攻 

(语句 、 选 择 结构 、 循 环 结构 和 函数 调用 ) 就 可 以 构 指数 2 2 

建 Java 程序 ， 所 以 程序 的 增长 量 级 通常 是 程序 规模 常见 的 增长 量 级 分 类 
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的 函数 ， 这 些 函 数 的 类 型 并 不 多 ， 我们 在 上 表 中 总 结 了 一 些 。 看 到 这 些 函 数 你 自然 会 想到 倍 
增 假设 ,我 们 可 以 通过 实际 运行 程序 来 验证 这 些 函 数 描述 是 否 准确 。 事 实 上 ， 你 已 经 运行 过 
一 些 具 有 这 样 的 增长 量 级 的 程序 ， 接 下 来 我 们 会 简单 讨论 。 

常量 型 。 运 行 时 间 的 增长 量 级 为 常数 的 程序 通常 执行 固定 数量 的 语句 来 完成 任务 。 因 
而 其 运行 时 间 不 依赖 于 问题 规模 。 第 1 章 中 的 前 几 个 程序 (如 HelloWorld (程序 1.1.1 ) 和 
LeapYear (程序 1.2.4 )) 就 属于 这 一 类 。Java 中 所 有 对 基本 类 型 的 操作 需要 的 时 间 都 是 常数 
级 的 ，Java 的 Math 库 中 函数 消耗 的 时 间 同 样 是 常量 。 请 注意 ， 我 们 说 的 常量 是 指 不 随 着 
输入 数据 变化 ， 并 不 是 指 每 个 函数 的 运行 时 间 都 相同 。 例 如 ，Math.tan(0) 消耗 的 时 间 常 量 比 
Math.abs() 消耗 的 要 大 。 

对 数 型 。 运 行 时 间 的 增长 量 级 为 对 数 的 程序 比 常量 时 间 的 程序 稍 慢 。 运 行 时 间 为 问题 
规模 对 数 的 经 典 程序 示例 是 在 一 个 有 序数 组 中 查找 一 个 值 ， 我 们 将 在 下 一 节 中 讨论 这 个 问题 
(参见 程序 4.2.3 中 的 BinarySearch) 。 对 数 的 底数 与 增长 量 级 无 关 〈 因 为 底数 为 任意 常数 的 所 
有 对 数 都 可 以 通过 一 个 常量 因子 相互 换算 )， 所 以 我 们 使 用 logn 表示 其 增长 量 级 。 当 我 们 关 
心 首 项 中 的 常数 参数 (如 使 用 波浪 符号 ) 时 ,需要 谨慎 指定 对 数 的 基数 。 如 符号 lgn 表示 二 
进 制 (底数 为 2 ) 对 数 ，lnn 表示 自然 (底数 为 e) 对 数 。 

线性 型 。 很 多 程序 处 理 每 条 输入 数据 或 者 单个 for 循环 结构 所 消耗 的 时 间 为 一 个 常量 。 
这 类 程序 的 增长 量 级 为 线性 的 其 运行 时 间 直 接 与 问题 规模 成 正比 。 用 于 计算 标准 输入 
中 数值 平均 值 的 程序 Average (程序 1.5.3 ) 就 是 一 个 典型 的 例子 ,在 1.4 节 中 混 排 一 个 数 
组 中 元 素 的 代码 也 是 一 个 例子 。 像 PlotFilter (程序 1.5.5 ) 过 滤器 程序 也 属于 这 一 分 类 ， 还 
有 在 3.2 节 中 讨论 的 各 种 图 像 处 理 过 滤器 ， 它 们 针对 每 一 个 输入 像素 执行 固定 数量 的 数学 
运算 。 

线性 对 数 型 。 对 于 问题 规模 n， 如 果 程 序 运 行 时 间 的 增长 量 级 为 n logn， 则 使 用 术语 线 
性 对 数 描述 该 程序 。 同 样 ， 程 序 运 行 时 间 的 增长 量 级 与 对 数 的 底数 无 关 。 例 如 ， 
CouponCollector (程序 1.4.2 ) 就 属于 线性 对 数 型 ， 另 一 个 典型 的 例子 是 归并 排序 ( 见 程 序 
4.2.6 )。 有 一 些 重要 问题 的 直接 解决 方案 是 二 次 型 的 ， 但 通过 巧妙 的 算法 设计 可 以 实现 为 线 
性 对 数 类 型 。 这 类 算法 (包括 归并 排序 ) 具有 jj 
非常 重要 的 实际 应 用 价值 ， 使 用 它们 能 够 解 > 
决 比 二 次 型 解决 方案 可 解决 的 规模 更 大 的 问 
题 。 在 4.2 节 中 ， 我 们 将 讨论 一 种 用 于 开发 
线性 对 数 算法 的 通用 设计 技巧 ， 称 为 分 治 
算法 。 

三 次 型 。 一 个 运行 时 间 的 增长 量 级 为 到 

的 典型 程序 一 般 包括 两 个 内 套 的 for 循环 ， 
用 于 某 种 处 理 所 有 nn 个 元 素 两 两 组 合 形成 的 8T 
数 对 的 计算 。 这 种 类 型 程序 的 典型 例子 是 4T 
Universe (程序 3.4.2 ) 中 计算 任意 两 个 星球 27 
之 间作 用 力 的 双重 组 套 循环 。 我 们 在 4.2 节 T 
中 讨论 的 插入 排序 算法 (程序 4.2.4 ) 也 是 一 
个 典型 的 例子 。 
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规模 一 1K 2K 4K 8K 1024K 
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名 称 增长 量 级 示例 结构 
常量 1 count++; 语句 (整数 递增 ) 
对 数 - 。 logn 了 本 人 划分 成 两 半 
(二 进 制 表示 中 的 位 ) 
for (int 1 =°0; 1 < ni i++) 
线性 n if (a[i] == 0) 单 层 循环 
count++; (检查 每 个 元 素 ) 
线性 对 数 - nlogn [ 见 Mergesort (程序 4.2.6 ) ] 分 治 (归并 排序 ) 
for (int 1 = 0; i < ni i++) 
二 次 m2 for (int j = i+1; j < n; j++) 双 层 嵌 套 循环 
时 if (a[i] + a[j] == 0) (检查 元 素 对 ) 
Count++; 
for Cint 1 = 0; i < ni i++) 
for (Cint j = i+l; j < n; j++) a p 
三 次 n3 for (int k = j+1; k < ni k++) 三 层 柑 套 循环 
if Ca[i] + ar[j] + afk] == 0) (检查 所 有 三 元 组 ) 
COUNt++; 
指数 2 [ see Gray code (PROGRAM 2.3.3) ] 穷 举 搜索 (检查 所 有 子 集 ) 


常见 增长 量 级 假设 


三 次 型 。 本 章 的 例子 ThreeSum 属于 三 次 型 (其 运行 时 间 增 长 量 级 为 到 )， 因 为 程序 包 
括 3 个 能 套 的 for 循环 ， 用 来 处 理 天 个 元 素 的 所 有 三 元 组 。 如 1.4 节 所 述 ， 用 于 两 个 产 义 着 
矩阵 的 相 乘 运算 的 运行 时 间 的 增长 量 级 为 mw ， 所 以 基本 的 和 矩阵 乘法 算法 通常 为 三 次 型 。 然 
而 ， 输 入 的 大 小 (矩阵 元 素 的 个 数 ) 与 n=m 成 正比 ， 所 以 算法 最 好 归 类 为 n”， 而 不 是 三 
次 型 。 

指数 型 。 正 如 2.3 节 所 述 ，TowersOfHanoi (程序 2.3.2 ) 和 Beckett (程序 2.3.3 ) 的 运 
行 时 间 都 与 2 成 正比 ， 因 为 程序 需要 处 理 n 个 元 素 的 所 有 子 集 。 通 常 ， 如 果 一 个 程序 的 增 
长 量 级 可 以 描述 为 2*”， 那 么 对 于 任何 正常 数 a 和 4b， 我 们 都 把 它 称 为 指数 型 算法 ， 即 使 不 
同 的 a 和 4b 值 会 导致 运行 时 间 大 不 相同 。 指 数 型 算法 非常 惕 ， 通 常 不 建议 对 于 大 规模 问题 运 
行 此 类 程序 。 指 数 型 算法 在 算法 理论 中 占据 重要 地 位 ， 因 为 存在 一 大 类 问题 ， 似 乎 指数 时 间 
的 算法 是 其 最 佳 选择 。 

本 节 中 列 出 的 增长 量 级 分 类 是 最 常用 的 ,但 显然 不 是 最 全 面 的 。 事 实 上 ,算法 的 详细 分 
析 可 能 需要 数 百 年 来 开发 的 全 部 数学 工具 。 理 解 诸 如 Factors (程序 1.3.9 )、PrimeSieve ( 程 
序 1.4.3 ) 和 Euclid (程序 2.3.1 ) 等 程序 的 运行 时 间 需 要 数论 方面 的 基本 结论 。 诸 如 HashST 
(程序 4.4.3) 和 BST (程序 4.4.4) 经 典 算 法 要 求 细 致 的 数学 分 析 。Sqrt (程序 1.3.6 ) 和 
Markov (程序 1.6.3 ) 是 数值 计算 的 原型 : 它们 的 运行 时 间 取 决 于 计算 到 期 望 数值 的 收敛 率 。 
而 我 们 感 兴趣 的 一 些 问 题 ， 诸 如 Gambler (程序 1.3.8 ) 及 其 变 体 之 类 的 模拟 ， 其 详细 数学 模 
型 根本 就 不 存在 。 

尽管 如 此 ， 你 编写 的 很 多 程序 具有 直观 的 性 能 特征 ， 可 以 使 用 我 们 描述 的 某 种 增长 量 级 
进行 精确 描述 。 因 此 ， 通 常 我 们 可 以 使 用 高 层次 的 假设 来 描述 一 个 算法 的 运行 时 间 特 性 。 例 
如 ， 我 们 可 以 说 归并 排序 运行 时 间 的 增长 量 级 是 线性 对 数 型 。 为 了 方便 ， 我 们 把 这 种 陈述 简 
化 成 归并 排序 是 线性 对 数 型 算法 。 我 们 大 多 数 关 于 运行 时 间 成 本 的 描述 都 使 用 这 种 形式 ,或 
者 采用 一 种 比较 式 的 描述 ， 如 归并 排序 比 插入 排序 更 快 。 同 样 ， 这 些 描 述 的 一 个 显著 特征 是 
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它们 不 是 关于 程序 特性 的 描述 ， 而 是 关于 算法 的 陈述 。 

预测 ”我们 可 以 通过 简单 地 运行 程序 来 估计 程序 的 运行 时 间 ， 但 是 当 问 题 规模 很 大 时 ， 
这 并 不 是 一 个 好 的 方法 。 这 种 情况 类 似 于 为 了 预测 火箭 的 落地 点 而 发 射 火 箭 ， 为 了 了 解 炸弹 
的 破坏 力 而 引爆 炸弹 ,或 者 为 了 预测 桥梁 是 否 坚 固 而 建设 桥梁 。 

了 解 运行 时 间 的 增长 量 级 ， 可 以 帮助 我 们 在 解决 大 规模 问题 时 做 出 决策 ， 以 便 投入 合适 
的 资源 来 处 理 实际 需要 解决 的 具体 问题 。 通 常 使 用 下 列 方式 之 一 来 验证 程序 运行 时 间 增 长 量 
级 的 假设 。 

估计 解决 大 型 问题 的 可 行 性 。 为 了 关注 运行 成 本 ， 对 于 编写 的 每 个 程序 ， 你 都 需要 回答 
这 样 一 个 基本 问题 : 程序 能 够 在 合理 的 时 间 内 处 理 其 输入 的 数据 吗 ? 例如 ， 如 果 问 题 规模 为 


n， 三 次 型 算法 需要 运行 几 秒 ， 当 问题 规模 为 AR 





100n 时 ， 程 序 将 需要 几 周 的 时 间 ， 因 为 其 会 慢 增长 拓 经 预期 的 运行 时 间 
100 万 倍 ， 而 几 百 万 秒 的 时 间 就 是 几 个 星期 。 如 Tt 
果 你 需要 解决 的 问题 规模 确实 如 此 ， 则 必须 找到 

一 个 更 好 的 解决 方法 。 了 解 算法 运行 时 间 的 增长 。 人 和 和 
量 级 ， 可 以 准确 地 得 到 程序 可 解决 的 问题 规模 极 2 机 
限 的 信息 。 这 就 是 研究 性 能 的 最 主要 的 原因 。 如 三 次 几 周 
果 没 有 这 些 信息 ,我 们 可 能 无 法 知道 一 个 程序 将 指数 无 穷 大 


消耗 多 少时 间 ; 通过 这 些 信息 ， 则 可 以 通过 粗略 对 运行 几 秒 的 程序 增加 问题 规模 产生 的 影响 
计算 来 估计 运行 成 本 。 

评估 使 用 更 快 计 算 机 的 价值 。 要 关注 运行 成 本 ， 还 面临 这 样 一 个 基本 问题 : 如 果 计算 机 
速度 更 快 ， 那 么 可 以 以 多 快 的 速度 解决 这 个 问题 ? 同样 ， 了 解 运 行 时 间 的 增长 量 级 正好 提供 
了 我 们 所 需要 的 信息 。 一 个 称 为 摩尔 定律 的 著名 经 验 法 则 表明 ， 每 隔 18 个 月 ， 计 算 机 的 运行 
速度 可 以 提高 1 倍 ， 内 存 可 以 增加 工 倍 ; 或 者 每 隔 5 年， 计算 机 的 速度 可 以 提高 10 倍 ， 内 存 
容量 增加 10 倍 。 一 般 很 自然 地 认为 如 果 我 们 购买 的 新 计算 机 速度 提高 了 10 倍 ， 而 且 内 存 容 
量 比 旧 计 算 机 容量 增加 10 倍 ， 那 么 我 们 可 以 解决 10 倍 规模 的 问题 ， 但 实际 上 ， 对 于 二 次 型 
或 三 次 型 算法 ， 结 论 并 非 如 此 。 无 论 是 投资 银行 家 每 天 运行 的 财务 模型 ， 还 是 科学 家 运行 程 
序 以 分 析 实 验 数 据 ， 或 者 是 工程 师 运 行 模拟 以 测试 一 种 设计 方案 ， 通 常 都 需要 几 小 时 才能 运 
行 完成 程序 。 假 设 我 们 正在 运行 一 个 时 间 为 三 次 型 的 程序 ， 然 后 购买 一 台 速 度 快 10 倍 、 内 存 
大 10 倍 的 新 计算 机 ， 不 仅 是 因为 需要 一 台新 的 计算 机 ， 而 是 因为 你 希望 处 理 的 问题 规模 也 能 
增 大 10 倍 。 但 是 让 人 失望 的 是 ,我 们 很 容易 就 能 预测 到 新 问题 需要 几 个 星期 才能 得 出 结果 ， 
因为 新 问题 增 大 了 1000 倍 ， 而 新 计算 机 的 速度 


比 起 旧 计 算 机 仅仅 提高 了 10 倍 。 这 种 情况 就 凸 eB te 
显 了 线性 和 线性 对 数 算法 的 重要 价值 ， 对 于 线 线性 1 
性 和 线性 对 数 算法 ， 对 于 一 台 比 旧 计 算 机 快 .10 线性 对 数 1 


倍 、 内 存 容 量 大 10 售 的 新 计算 机 ， 可 以 在 同样 


的 时 间 内 解决 比 旧 计算 机 能 解决 的 问题 规模 大 EE 

10 倍 的 问题 。 换 句 话 说， 如 果 使 用 二 次 型 或 三 三 次 oy 

次 型 算法 ， 则 根本 无 法 跟 上 摩尔 定律 的 速度 。 指数 无 大 
比较 程序 。 我 们 一 直 在 努力 改进 程序 ， 也 使 用 快 10 售 的 计算 机 处 理 


经 常 扩展 或 修正 假设 以 评估 改进 的 有 效 性 。 基 大 10 倍 的 问题 的 效果 比较 


296 入 4 并 


于 对 性 能 的 预测 ， 在 开发 过 程 中 可 以 进行 设计 决策 来 指导 我 们 实现 更 好 、 更 高 效 的 代码 。 
举例 来 说 ， 新 手 程序 员 可 能 已 经 在 ThreeSum (程序 4.1.1) 中 编写 了 租 套 for 循环， 如 下 
所 示 : 

for TInt 1 = 0 1 < nr THFy 

for (Cint 3 = 0; j < hn; j++) 
for (int k = 0; k < k++) 
证 Cx Te < 
人 Ty + a[k] == 0) 
Count++; 

这 段 代码 中 内 层 循环 中 指令 的 执行 频率 恰好 是 nn (而 不 是 约 为 n/16 )。 制 定 和 验证 “这 
个 变 体 程序 比 ThreeSum 慢 6 倍 ” 的 假设 是 很 容易 的 。 值 得 注意 的 是 ， 对 于 不 在 内 层 循环 中 
的 代码 ， 这 样 的 改进 带 来 的 影响 微乎其微 。 

更 一 般 地 说 ， 如 果 给 定 两 个 解决 相同 问题 的 算法 ,我 们 想 知 道 哪个 算法 解决 问题 时 使 用 
更 少 的 计算 资源 。 在 很 多 情况 下 ， 我 们 可 以 确定 运行 时 间 的 增长 量 级 ， 建 立 关 于 比较 性 能 的 
准确 假设 。 增 长 量 级 在 这 个 过 程 中 十 分 重要 ， 因 为 它 允 许 我 们 把 一 个 特定 的 算法 与 其 他 所 有 
类 别 的 算法 进行 比较 。 例 如 ， 如 果 一 个 问题 已 经 有 线性 对 数 算法 解决 方案 ， 则 我 们 对 由 三 次 
型 或 三 次 型 算法 (即使 它们 被 高 度 优化 ) 解决 同样 的 问题 就 不 太 感 兴趣 了 。 

注意 事项 ” 当 尝 试 详细 分 析 程 序 性 能 时 ,许多 原因 都 可 能 导致 不 一 致 或 错误 的 结果 。 所 
有 的 原因 或 多 或 少 都 与 “我 们 的 结论 中 一 个 或 多 个 基本 假设 不 太 正确 ”有 关 。 我 们 可 以 基于 
新 的 假设 来 得 到 新 的 结论 。 在 分 析 的 过 程 中 ,我 们 考虑 的 细节 越 多 ， 越 要 认真 仔细 地 分 析 。 

旨 信 时间 。 我 们 假设 每 条 指令 总 是 花费 相同 的 时 间 ， 其 实 这 并 不 总 是 正确 的 。 例 如 ， 大 
多 数 现代 计算 机 系统 均 使 用 一 种 称 为 缓存 〈cache) 的 技术 来 管理 内 存 ， 在 这 种 情况 下 ， 如 
果 数 组 中 的 数字 位 置 并 不 相 邻 ， 访 问 超 大 数组 中 的 元 素 可 能 会 花费 较 长 的 时 间 。 通 过 让 
DoublingTest 运行 一 段 时 间 ， 可 以 观察 到 缓存 对 ThreeSum 的 影响 。 你 会 发 现在 收敛 到 8 之 
后 ， 如 果 继 续 增 大 数据 规模 ， 运 行 时 间 的 比值 将 跳跃 到 一 个 较 大 的 数值 ， 这 是 缓存 对 程序 行 
为 的 影响 造成 的 。 

非 主 导 地 位 的 内 层 循 环 。 内 层 循 环 占 主导 地 位 的 假设 可 能 并 不 总 是 正确 的 。 问 题 规模 n 
也 许 不 够 大 ， 内 层 循环 指令 的 执行 频率 虽然 是 主导 项 ,但 相对 于 次 要 项 的 差异 没有 大 到 可 以 
忽略 次 要 项 。 有 些 程序 在 内 层 循环 之 外 包含 大 量 代码 ， 也 需要 加 以 考虑 。 

系统 考虑 。 通 常情 况 下 ， 计 算 机 中 有 许多 程序 在 运行 。Java 仅仅 是 许多 竞争 资源 的 应 
用 程序 之 一 ， 而 Java 本 身 包含 很 多 可 以 显著 影响 性 能 的 控制 选项 。 这 些 可 能 会 干扰 科学 
方法 中 的 基本 原则 : 实验 应 该 是 可 以 复 现 的， 但 是 这 个 时 刻 发 生 在 计算 机 上 的 事情 永远 无 
法 再 被 复制 。 无 论 你 的 计算 机 系统 在 运行 什么 (这 是 你 无 法 控制 的 )， 原 则 上 都 应 该 可 以 
忽略 。 

难 分 伯仲 。 通 常 ， 当 我 们 比较 同一 个 任务 的 两 个 不 同 程序 时 ， 一 个 可 能 在 某 些 情况 下 更 
快 ， 而 在 其 他 情况 下 更 慢 。 上 述 讨 论 的 一 个 或 多 个 因素 可 能 会 对 此 有 影响 。 另 外 ， 一 些 程序 
员 ( 以 及 某 些 学 生 ) 存在 一 种 自然 的 倾向 ， 就 是 喜欢 投入 大 量 精力 运行 这 种 赛马 程序 来 找到 
“最 佳 ”的 实现 ， 但 这 样 的 工作 最 好 留 给 专家 去 做 。 

强烈 依赖 输入 值 。 我 们 确定 一 个 程序 运行 时 间 的 增长 量 级 的 假设 之 一 是 运行 时 间 应 该 主 
要 取决 于 问题 的 规模 〈 而 与 输入 值 无 关 )。 如 果 情 况 并 非 如 此 ， 则 可 能 会 得 到 不 一 致 的 结果 ， 
或 无 法 验证 我 们 的 假设 。 我 们 采用 的 例子 ThreeSum 不 存在 这 个 问题 ， 但 是 我 们 编写 的 许多 
程序 确实 会 产生 这 个 问题 。 读 者 可 以 在 本 章 中 看 到 儿 个 这 样 的 程序 。 通 常 ， 设 计 的 主要 目标 


个 法 币 数 据 络 欧 297 


是 消除 这 种 对 输入 值 的 依赖 。 如 果 不 能 实现 这 个 目标 ， 则 必须 为 输入 数据 建立 一 个 细致 的 模 
型 ， 用 于 指导 程序 行为 的 分 析 ， 这 可 能 是 一 个 更 大 的 挑战 。 例 如 ， 如 果 我 们 正在 编写 一 个 处 
理 基因 组 的 程序 ， 如 何 判断 其 针对 不 同 的 基因 组 的 效果 ? 一 个 良好 地 描述 自然 界 基因 组 的 模 
型 正 是 科学 家 所 寻求 的 ， 所 以 预测 我 们 的 程序 在 自然 界 中 发 现 的 数据 上 的 运行 时 间 将 对 模型 
做 出 有 价值 的 贡献 ! 

多 个 问题 参数 。 我 们 一 直 关 注 使 用 单一 参数 n 的 函数 来 测量 性 能 ， 这 个 参数 通常 是 命 
令 行 参数 的 值 或 输入 的 规模 。 但 是 存在 多 个 这 样 的 参数 来 确定 待 处 理 的 数据 量 的 情况 并 不 罕 
见 。 例如 ,假设 a[] 是 长 度 为 m 的 数组 ， 而 b[] 是 长 度 为 n 的 数组 。 考 虑 以 下 代码 片段 ， 它 
计算 a[ 引 + 四 等 于 0 的 所 有 【无 序 ) i 和 j 数 对 的 数量 : 

for (int i = 0; i < m; i++) 

for (int j = 0; j < n; j++) 
if (a{li] + b[j] == 0) 
Count++; 

运行 时 间 的 增长 量 级 取决 于 两 个 参数 一 一 m 和 n。 在 这 种 情况 下 ， 我 们 分 别处 理 参数 ， 
在 研究 一 个 参数 的 时 候 将 男 一 个 参数 固定 。 例 如 ， 上 述 代码 片段 运行 时 间 的 增长 量 级 是 
mXn。 同 样 ，LongestCommonSubsequence (程序 2.3.6 ) 包含 两 个 参数 m (第 一 个 字符 串 的 
长 度 ) 和 (第 二 个 字符 串 的 长 度 )， 因 此 ， 其 运行 时 间 的 增长 量 级 是 mXn。 

尽管 有 这 些 注 意 事项 ， 但 理解 每 个 程序 运行 时 间 的 增长 量 级 对 于 每 个 程序 员 而 言 都 是 有 
价值 的 知识 ,而 且 我 们 刚才 所 阐述 的 方法 非常 强大 并 且 广 泛 适用 。Knuth 的 观点 是 ， 原 则 上 
我 们 可 以 通过 使 用 这 些 方 法 来 实现 详细 、 准 确 的 预测 。 典 型 的 计算 机 系统 非常 复杂 ， 精 密 的 
分 析 最 好 交 给 专家 ， 但 同样 的 方法 对 于 近似 估计 任何 程序 的 运行 时 间 都 是 有 效 的 。 就 像 火 箭 
科学 家 需要 了 解 某 次 测试 发 射 会 降落 在 海洋 还 是 城市 ， 医 学 研究 者 需要 知道 药物 试验 会 杀 死 
还 是 治愈 所 有 的 受 试 者 ， 使 用 计算 机 程序 的 科学 家 和 工程 师 则 需要 知道 程序 会 运行 一 秒 还 是 
一 年 。 

性 能 保证 ”对 于 某 些 程序 ， 我 们 要 求 对 于 给 定 规模 的 任何 输入 ， 程 序 的 运行 时 间 都 小 
于 某 个 界限 。 为 了 提供 这 样 的 性 能 保证 ， 理 论 家 希望 得 到 一 种 最 悲观 的 结论 : 在 最 坏 的 情况 
下 ， 程 序 运行 时 间 会 是 多 少 ? 

例如 ， 这 种 保守 的 方法 可 能 适用 于 运行 核反应 堆 、 空 中 交通 管制 系统 或 汽车 刹车 软件 。 
我 们 必须 保证 这 类 软件 能 在 我 们 设 定 的 时 间 内 完成 工作 ， 否 则 将 会 导致 灾难 性 后 果 。 科 学 家 
在 研究 自然 界 时 通常 不 会 考虑 最 坏 的 情况 : 在 生物 学 中 ， 最 坏 的 情况 也 许 是 人 类 的 灭绝 ; 在 
物理 学 中 ， 最 坏 的 情况 可 能 是 宇宙 的 终结 。 但 是 在 计算 机 系统 中 ,最 糟糕 的 情况 是 我 们 真正 
需要 关心 的 事情 ， 因 为 输入 是 由 另 一 个 (潜在 恶意 ) 用 户 生成 的 ， 而 不 是 自然 产生 的 。 例 如 ， 
没有 使 用 性 能 保证 算法 的 网 站 党 遭受 拒绝 服务 ( denial-of-service) 攻击 ， 黑 客 通过 发 送 大 量 
洪水 般 的 请 求 ， 使 网 站 造成 灾难 性 的 性 能 下 降 。 

性 能 保证 很 难 用 科学 的 方法 来 验证 ， 因 为 我 们 无 法 使 用 所 有 可 能 的 输入 测试 一 个 假设 ， 
比如 对 于 增长 量 级 为 线性 对 数 型 的 归并 排序 算法 ， 可 能 的 输入 组 合 太 多 ,不 可 能 一 一 尝试 。 
我 们 可 能 会 提供 一 组 输入 让 归并 排序 很 慢 ， 但 是 如 何 能 证 明 这 就 是 最 慢 的 情况 呢 ? 我 们 必须 
使 用 数学 分 析 ， 而 不 能 使 用 实验 方法 。 

算法 分 析 人 员 的 任务 是 尽 可 能 多 地 发 现 有 关 算 法 的 信息 ， 应 用 程序 员 的 任务 是 应 用 这 些 
知识 来 开发 有 效 解决 问题 的 程序 。 例 如 ， 如 果 你 正在 使 用 二 次 时 间 算 法 来 解决 问题 ， 但 是 后 
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来 找到 能 够 保证 最 差 情 况 为 线性 对 数 时 间 的 算法 ， 显 然 你 会 更 喜欢 线性 对 数 时 间 算 法 。 在 极 
少数 情况 下 ， 你 可 能 更 喜欢 二 次 时 间 算 法 ， 因 为 对 于 你 需要 解决 的 某 种 输入 ， 三 次 型 算法 运 
行 更 快 ， 或 者 因为 线性 对 数 算法 的 实现 太 复 杂 。 

理想 的 情况 下 ， 我 们 需要 能 够 让 代码 显得 清晰 紧凑 的 算法 ， 它 既 提 供 了 良好 的 最 差 情 况 
保证 ， 又 在 常见 的 输入 上 有 良好 的 性 能 。 我 们 在 本 章 讨论 的 许多 经 典 算法 对 于 多 种 应 用 都 具 
有 重要 意义 ， 因 为 它们 具有 上 述 特性 。 使 用 这 些 算 法 作为 模型 ， 读 者 可 以 针对 编程 时 遇 到 的 
典型 问题 ， 自 行 设 计 好 的 解决 方案 。 

内 存 ， 与 运行 时 间 一 样 ， 程 序 的 内 存 使 用 与 物理 世界 直接 关联 : 因为 内 存在 计算 机 中 占 
据 了 相当 大 量 的 电路 ， 是 实现 程序 的 数据 存储 和 随后 访问 的 关键 物理 介质 。 在 给 定时 间 内 ， 
你 需要 存储 的 值 越 多 ， 所 需 的 电路 就 越 多 。 为 了 控制 成 本 ， 你 必须 关注 内 存 的 使 用 情况 。 你 
也 许 已 经 意识 到 计算 机 内 存 使 用 的 一 些 限制 (有 时 甚至 比 时 间 限 制 更 重要 )， 因 为 你 可 能 需 
要 花费 额外 的 金钱 来 获取 更 多 的 内 存 。 

在 计算 机 上 Java 很 好 地 定义 了 内 存 使 用 (每 次 运行 程序 时 ， 每 个 值 占用 同样 大 小 的 内 
存 ), 但 是 Java 可 以 在 各 种 计算 设备 上 实现 ， 并 且 内 存 消耗 与 实现 有 关 。 为 了 简单 起 见 ， 我 
们 使 用 术语 “典型 的 ”来 表示 受 机 器 影响 的 值 。 在 一 个 典型 的 64 位 机 器 上 ， 计 算 机 内 存 被 
划分 成 字 ， 每 64 位 字 由 8 字 节 组 成 ， 每 字 节 包含 8 位 ， 每 位 是 一 个 二 进 制 数 字 。 

分 析 内 存 使 用 情况 与 分 析 时 间 使 用 情况 有 些 不 同 ， 主 要 是 因为 Java 最 重要 的 功能 特性 
之 一 就 是 内 存 分 配 系统 ， 其 设计 目标 是 减轻 管理 内 存 的 繁重 工作 。 目 前 ， 建 议 读 者 在 适当 的 
时 候 充分 利用 这 个 功能 。 尽 管 如 此 ， 你 仍 有 责任 了 解 ， 或 者 至 少 大 概 了 解 ， 程 序 的 内 存 需求 
何 时 会 妨碍 用 户 解决 给 定 问题 。 





基本 类 型 。 估 算 简 单程 序 的 内 存 使 用 情况 很 容易 ， 就 像 我 类 型 字 节 数 
们 在 第 章 中 讨论 的 那样 : 计算 变量 的 数目 » 并 根据 变量 的 类 boolean | 
型 乘 以 各 变量 占用 的 字 节 数 。 例 如 ， 由 于 Java 的 int 数据 类 型 代 byte 1 
表 了 在 -2 147 483 648 和 2 147 483 647 之 间 的 整数 值 集 合 ， 总 char 2 
共有 2” 个 不 同 的 取 值 ， 典 型 的 Java 实现 采用 32 位 (4 字 节 ) 来 int 4 
表示 每 个 int 值 。 类 似 地 ， 典 型 的 Java 实现 用 2 字 节 (16 位 ) 表 float 4 
示 char 值 ， 用 8 字 节 (64 位 ) 表示 double 值 ， 用 1 字 节 表示 long 8 
boolean 值 (因为 计算 机 一 次 最 少 就 是 访问 1 字 节 )。 例 如 ， 如 果 double 8 


你 的 计算 机 有 1GB 的 内 存 (大 约 10 亿 字 节 )， 那么 任何 时 候 ， 内 ”一 些 基本 类 型 的 典型 内 存 需求 
存 都 无 法 容纳 多 于 2.56 亿 个 int 值 或 者 1.28 亿 个 double 值 。 

对 象 。 为 了 确定 对 象 的 内 存 使 用 情况 ,我们 要 计算 每 个 实例 变量 使 用 的 内 存 大 小 ， 同 时 
还 要 加 上 每 个 对 象 产 生 的 额外 开销 ， 通 常 为 16 字 节 。 内 存 通常 被 填充 (向 上 取 整 ) 为 8 字 
节 的 信 数 一 一 当前 硬件 中 内 存 “ 字 ”的 整数 倍 。 

例如 ， 在 一 个 典型 的 系统 中 ， 一 个 Complex (程序 3.2.6 ) 对 象 使 用 32 字 节 (16 字 节 
的 开销 ， 以 及 两 个 double 型 变量 ， 每 个 占据 8 字 节 )。 由 于 许多 程序 创建 了 数 百 万 个 Color 
对 象 ， 因 此 一 种 典型 的 Java 实现 是 将 其 所 需 的 信息 打包 为 一 个 32 位 的 int 值 。 所 以 , 一 个 
Color 对 象 使 用 24 字 节 ( 16 字 节 的 开销 ，4 字 节 用 于 存储 int 实例 变量 ，4 字 节 用 于 填充 )。 

对 象 引用 通常 使 用 8 字 节 (1 个 字 ) 的 内 存 。 当 一 个 类 使 用 一 个 对 象 引用 作为 实例 变量 
时 ， 必 须 将 对 象 引 用 的 内 存 (8 字 节 ) 和 对 象 本 身 所 需 的 内 存 分 开 计算 。 例 如 ，Body (程序 
3.4.1 ) 对 象 使 用 168 字 节 : 对 象 本 身 的 开销 (16 字 节 )、 存 储 一 个 double 值 的 开销 (8 字 节 ) 
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和 两 个 引用 的 开销 (每 个 8 字 节 )， 再 加 上 Vector 对 象 所 需 的 内 存 (Vector 对 象 的 内 存 消耗 
我 们 稍 后 讨论 )。 

数组 。Jav# 中 的 数组 作为 对 象 实现 ， 通 常 Come 入 全 于 
使 用 二 个 int 实例 变量 表示 数组 长 度 。 对 于 基本 private doume re; | 
数据 类 型 一 个 由 nn 个 元 素 组 成 的 数组 需要 24 。 .和 
字 节 的 内 存 开 销 (16 字 节 的 对 象 开销 、4 字 节 
的 长 度 、4 字 节 的 填充 )， 再 加 上 售 存 储 每 个 
元 素 所 需 的 字 节 数 。 例 如 ，Sample (程序 1.4.1) 
中 的 int 数组 使 用 4"+24 字 节 的 开销 ;Coupon os 对象 (java 库 ) 
(程序 1.4.2 ) 中 的 布尔 数组 使 用 n+24 字 节 的 开 。 pubric oass carer 
销 。 请 注意 ， 一 个 布尔 数组 的 每 个 元 素 消耗 1 Private int value; 
字 节 的 内 存 (浪费 了 8 位 中 的 7 位 ) 一 一 通过 ? | ine 
一 些 额外 的 手段 ， 我 们 可 以 让 每 个 元 素 只 使 用 ER 
1 位 来 完成 这 个 工作 (参见 练习 4.1.26 )。 ee 

一 个 对 象 数 组 是 对 象 引用 的 数组 ， 所 以 Body 对 象 ( 程 序 3.4.1 ) 和 +2 个 向 量 
我 们 需要 同时 考虑 引用 的 内 存 和 对 象 的 内 存 。 pubvic class Bouy PE 
例如 ， 一 个 包含 n 个 Charge 对 象 的 数组 消耗 Prede eel 中 
48n+24 字 节 ; 数组 开销 (24 字 节 )、Charge 的 引 .eee owe nase 省 
用 (8n 字 节 ) 和 Charge 对 象 的 内 存 (407 字 节 )。 
这 个 分 析 假设 所 有 的 对 象 都 是 不 同 的 : 多 个 数 
组 元 素 可 能 引用 相同 的 Charge 对 象 (别名 )。 

类 Vector (程序 3.3.3) 包含 一 个 数组 作 AAA 
为 实例 变量 。 在 典型 的 系统 中 ， 长 度 为 ”的 对 座 的 来 型 内 种 需求 
Vector 对 象 需要 8n+48 字 节 的 开销 : 对 象 开销 (16 字 节 )、 对 double 数组 的 引用 (8 字 节 ) 
和 double 数组 所 占 的 内 存 ( 8n+24 字 节 )。 因 此 ，Body 中 的 每 个 Vector 对 象 都 使 用 64 字 节 
的 内 存 (因为 n=2)。 

字符 串 对 象 。 我 们 使 用 与 其 他 对 象 相同 的 方式 来 计算 String 对 象 消耗 的 内 存 。 长 度 为 
n 的 String 对 象 通常 消耗 24+56 字 节 : 对 象 开销 (16 字 节 )、 对 char 数组 的 引用 (8 字 节 )、 
char 数组 所 占 的 内 存 (2n+24 字 节 ) 和 一 个 iat 型 变量 (1 字 节 ) 及 填充 的 开销 (4 字 节 )。 
String 对 象 中 的 int 实例 变量 是 一 个 散 列 码 ， 其 在 某 些 情况 下 可 以 避免 重复 计算 ， 现 在 还 不 
用 关心 它 的 用 途 。 如 果 字符 串 中 的 字符 数 不 是 4 的 倍数 ， 则 会 填充 字符 数组 的 内 存 ， 以 使 
char 数组 的 字 节 数 为 8 的 倍数 。 


-double 型 值 
(每 个 8 字 节 ) 





16 字 节 
int 型 值 





引用 (每 
个 8 字 节 ) 


double 型 值 
(8 字 节 ) 





Vector 对 象 ( 程序 3.3.3 ) ”24 字 节 +double 型 数组 ( 8n+24 字 节 ) String 对 象 (Java 库 ) ”40 字 节 +char 型 数组 ( 2n+24 字 节 ) 


public class Vector public class String 
{ 


private double[] coords; 16 字 节 private int hash; 
a private char[] value; 
} Se 
引用 } 
(8 字 节 ) 





Vector 和 String 对 象 的 典型 内 存 需求 
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二 维 数组 。 正 如 我 们 在 1.4 节 看 到 的 ，Java 中 的 二 维 数组 是 数组 的 数组 。 因 此 ，Markov 
(程序 1.6.3 ) 中 的 二 维 数组 消耗 8z2+327z+24 (或 ~8m?) 字 节 : 数组 中 每 个 数组 的 开销 (24 
字 节 )、 对 行 数组 的 n 个 引用 (8n 字 节 ) 和 n 行 数组 (每 个 8n+24 字 节 )。 如 果 数 组 元 素 是 对 
象 ， 即 数组 由 用 对 象 的 引用 填充 的 数组 构成 ,通过 近似 的 计算 得 到 ~8n? 字 节 ， 这 里 我 们 需 
要 把 这 些 对 象 本 身 占据 的 内 存 也 算 在 内 。 

这 些 基 本 的 机 制 适用 于 估算 大 多 数 程序 的 内 存 使 用 情况 。 但 是 存在 很 多 复杂 的 因素 会 导 
致 内 存 估算 十 分 困难 。 我 们 已 经 注意 到 了 缓存 可 能 带 来 的 潜在 影响 。 此 外 ， 当 涉及 函数 调用 
时 ， 内 存 消耗 是 一 个 复杂 的 动态 过 程 ， 系 统 内 存 分 配 机 制 扮演 着 更 重要 的 角色 ,并且 具有 系 
统 依赖 性 。 例 如 ， 当 程序 调用 一 个 函数 时 ， 系 统 从 一 个 





称 为 栈 的 特殊 内 存 区 分 配 函 数 对 于 函数 的 局 部 变量 ) 所 一 | 
需 的 内 存 ， 当 函数 返回 给 调用 者 时 ， 内 存 被 回收 到 酚 。 ”“ 人 
由 于 这 个 原因 ， 在 递归 函数 中 创建 数组 或 其 他 大 对 象 是 “oonen B1424 gn 
一 件 很 危险 的 事 ， 因 为 每 个 递归 调用 都 意味 着 大 量 的 内 charoet] 40n + 24 ~ 40n 
存 消耗 。 当 你 用 new 创建 一 个 对 象 时 ， 系 统 从 一 个 称 为 。 ”vector 和 
堆 的 特殊 区 域 为 对 象 分 配 所 需 的 内 存 ， 必 须 记 住 每 人 对 | 人 
象 都 会 一 直 存在 ， 直 到 没有 引用 指向 该 对 象 ， 此 时 一 个 ng | 324 30424 -人 


称 为 垃圾 回收 的 系统 进程 会 从 堆 中 回收 内 存 。 这 种 动态 double[][] | 8n2+32n+24 ~ 8n2 
过 程 会 使 得 精确 估计 程序 的 内 存 占用 量变 得 十 分 困难 。 可 变 长 度数 据 类 型 的 典型 内 存 需求 

展望 ”良好 的 性 能 对 于 一 个 程序 十 分 重要 。 运 行 起 
来 慢 得 不 可 思议 的 程序 几乎 等 同 于 一 个 错误 的 程序 ， 都 没有 什么 用 处 ， 所 以 从 一 开始 就 要 注 
意 成 本 ， 以 便 我 们 能 够 了 解 可 以 解决 哪些 类 型 的 间 题 。 特别 地 ， 理 解构 成 程序 内 循环 的 代码 
总 是 明智 的 。 

在 程序 设计 中 ， 也 许 最 常 犯 的 错误 就 是 过 度 关注 性 能 。 程 序 设计 的 首要 任务 是 使 代码 清 
晰 且 正 确 。 如 果 修 改 程序 的 唯一 目的 是 加 速 程序 ， 那 么 这 件 事 最 好 留 给 专家 。 事 实 上 ,这样 
做 的 结果 往往 适得其反 ， 因 为 这 种 情况 下 创建 的 代码 往往 复杂 并 且 难 以 理解 。C. A. R. Hoare 
(快速 排序 算法 的 发 明 者 ， 也 是 编写 清晰 且 正 确 的 代码 的 主要 支持 者 ) 曾经 总 结 了 这 个 观点 ， 
他 说 :“ 不 成 熟 的 优化 是 一 切 错误 的 根源 。”Knuth 为 这 名 话 加 上 了 限定 词 “ 在 (至少 大 多 数 ) 
程序 设计 中 ”。 除 此 之 外 ;如 果 可 以 节省 的 成 本 有 限 ， 则 改善 运行 时 间 是 不 值得 的 。 例 如 ， 
如 果 运 行 时 间 只 是 一 个 瞬间 ， 则 将 程序 的 运行 速度 提高 10 倍 是 没有 什么 意义 的 。 即 使 一 个 
程序 的 运行 时 间 需 要 几 分 钟 ， 实 现 和 调试 一 个 改进 算法 所 需 的 总 时 间 也 可 能 远 远 超过 仅仅 运 
得 中 才 更 糟糕 的 是 ， 你 可 
能 花费 大 量 的 时 间 和 精力 思考 改进 程序 ， 但 实际 上 并 没有 任何 效果 。 

在 开发 一 个 算法 时 第 二 个 常 犯 的 错误 是 忽略 性 能 特征 。 更 快 的 算法 通常 比 粗糙 的 解决 
方案 复杂 得 多 ， 所 以 你 可 能 趋向 于 接受 一 个 较 慢 的 算法 来 避免 处 理 更 复杂 的 代码 。 但 是 ， 有 
时 通过 几 行 优秀 的 代码 就 可 以 节省 巨大 的 资源 。 即 使 线性 或 线性 对 数 算 法 仅仅 稍微 复杂 一 
些 ， 也 能 用 更 短 时 间 解 决 问题 ,但 是 大 部 分 计算 机 系统 用 户 却 选 择 花费 大 量 时 间 来 等 待 简单 
的 二 次 型 算法 来 完成 问题 的 求解 。 只 有 处 理 大 型 的 问题 时 我 们 才 别 无 选择 ， 只 能 寻求 更 好 的 
算法 。 

改善 程序 使 其 更 加 清晰 、 高 效 和 优雅 应 该 作为 我 们 每 次 程序 设计 的 目标 。 如 果 开 发 一 个 
程序 的 整个 过 程 中 我 们 一 直 关 注 成 本 ,那么 每 次 使 用 这 个 程序 时 都 会 从 中 受益 。 
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一 个 int 类 型 的 数组 (程序 1.4.1 ) 一 个 double 类 型 的 数组 ( 程序 2.1.4 ) 
int[] perm = new int[n]; double[] c = new double[n]; 
中 对 象 睛 -一 16 字 节 -一 16 字 节 
趾 开销 
int 类 型 值 int 类 型 值 
(4 字 节 ) (4 宇 节 ) 
六 7 个 int 类 型 值 个 
< 一 (4n 字 节 ) 上 2 个 int 类 型 值 24 
Rg | 8n 字 节 ) 2 
总 计 : 4n+24 (7 为 偶数 ) WA 对 象 上 < 一 16 字 节 
总 计 : 8n+24 开销 | 
由 一 4 字 节 
40 字 节 于 






nn 个 double 
< 类 型 值 
(8n 字 节 ) 


带电 粒子 的 数组 (程序 3.1.7 ) 


Charge[] a = new Charge[n]; 
for (int k = 0; k < ni k++) 
{ 


二 维 数组 (程序 1.63) 


double[][] a = new double[n][n]; 






Ss 


ar = new Charge(x0, y0, q0); 
} 


Boo 


16 字 节 


int 类 型 值 
(4 字 节 ) 


16 字 节 


int 类 型 值 
(4 字 节 ) se 
17 个 引用 
Em | (gx 字 节 ) 
7 个 引用 






总 计 : 24+8n+(nx40)=48n+24 





总 计 ; 24+8ntnx(24+8n)=8n2+32n+24 


中 E 
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问答 环节 


问 : 我 如 何 知道 在 我 的 计算 机 上 两 个 浮 点 数 的 加 法 或 者 乘法 需要 消耗 多 长 时 间 ? 

答 : 运行 一 些 实验 ， 你 自己 就 能 找到 答案 ! 本 书 官网 上 的 TimePrimitives 程序 使 用 
Stopwatch 来 测试 不 同 算术 运算 在 基本 类 型 上 的 执行 时 间 。 这 种 技术 也 可 用 于 测量 程序 实际 
运行 的 时 间 ， 就 像 观测 挂钟 一 样 。 如 果 你 的 系统 没有 运行 许多 其 他 程序 ， 这 可 以 产生 比较 准 
确 的 结果 。 读 者 可 以 在 本 书 官网 上 找到 更 多 关于 改进 这 些 实验 的 信息 。 

问 : 调用 Math.sin()、Math.log() 和 Math.sqrt(0) 需要 多 少时 间 ? 
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答 : 运行 一 些 实验 ， 你 自己 就 能 找到 答案 ! 利用 Stopwatch 可 以 很 容易 编写 类 似 于 
TimePrimitives 的 程序 来 回答 这 类 问题 ， 如 果 习 惯 了 这 些 操 作 ， 你 将 能 够 更 加 有 效 地 使 用 计 
算 机 。 

问 : 字符 串 操作 需要 多 长 时 间 ? 

答 : 运行 一 些 实 验 ， 你 自己 就 能 找到 答案 ! (你 应 该 能 接收 到 我 们 想 传达 的 信息 了 吧 ? ) 
String 数据 类 型 的 实现 允许 方法 length( 和 charAt( 在 常数 时 间 内 运行 。 诸如 toLowerCase() 
和 replace() 之 类 方法 的 运行 时 间 与 字符 串 的 长 度 线性 相关 。 方 法 compareTo()、equals()、 
startsWith() 和 endsWith() 需要 的 时 间 与 解析 答案 所 需 的 字符 数 成 正比 (最 好 的 情况 是 常数 时 
间 ， 最 差 的 情况 是 线性 时 间 )， 但 方法 indexOf0 会 很 慢 。 字 符 串 拼接 以 及 substring() 方法 需 
要 的 时 间 正 比 于 结果 中 的 字符 总 数 。 

问 : 为 什么 分 配 一 个 大 小 为 n 的 数组 消耗 的 时 间 与 n 成 正比 ? 

答 : Java 把 数组 元 素 自动 初始 化 为 默认 值 (0、false 或 null)。 原 则 上 ， 如 果 计 算 机 将 
每 个 元 素 的 初始 化 推迟 到 程序 第 一 次 访问 该 元 素 ， 这 会 是 个 常数 时 间 的 操作 。 但 是 大 多 数 的 
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问 : 如 何 确定 Java 程序 可 用 的 内 存 容 量 ? 

答 : 内 存 不 足 时 Java 会 告诉 你 ， 可 以 通过 运行 一 些 实验 来 验证 。 例 如 ， 使 用 PrimeSieve 
(程序 1.4.3 )， 输 入 


% java PrimeSieve 100000000 


并 得 到 结果 


50847534 


接着 又 输入 


% java PrimeSieve 1000000000 


并 得 到 结果 


Exception in thread "main" 
java.1lang.0utOfMemoryError: Java heap space 


结果 表明 有 足够 的 空间 来 存放 一 个 大 小 为 1 亿 的 布尔 数组 ， 但 无 法 存放 一 个 大 小 为 10 
亿 的 布尔 数组 。 你 可 以 使 用 命令 行 选项 增加 分 配给 Java 的 内 存 容量 。 以 下 命令 使 用 命令 
行 参数 1 000 000 000 和 命令 行 选项 “ -Xmx1110mb” 来 执行 PrimeSieve， 该 命令 要 求 最 多 
1 100MB 内 存 (如 果 系 统 中 有 足够 的 可 用 内 存 )。 


% java -Xmxl100mb PrimeSieve 1000000000 


问 : 当 有 人 说 最 坏 运行 时 间 为 O(n”) 时 ,意味 着 什么 ? 

答 : 这 是 一 种 被 称 为 大 0 的 表示 法 。 如 果 存 在 常量 c 和 no。， 对 于 所 有 的 n>no 满 足 
Wn)| 志 clg(D)|， 则 可 将 ftn) 表示 为 O(g(n))。 换 名 话说， 函数 ftn) 的 上 限 是 g(n)， 这 时 我 们 
忽略 了 常量 因子 ， 并 假设 的 值 足够 大 。 例 如 ,函数 30n*+10n+7 是 O(n”)。 对 于 所 有 可 能 
的 输入 ， 如 果 一 个 输入 大 小 为 n 的 函数 运行 时 间 为 O(g(n)), 那么 算法 的 最 差 运 行 时 间 为 
O(g(n))。 大 O 表示 法 和 最 差 运行 时 间 被 理论 计算 机 科学 家 广泛 用 于 证 明 算 法 的 理论 依据 ， 

所 以 如 果 你 选修 了 算法 和 数据 结构 课程 ， 肯 定 见 过 这 个 符号 。 
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问 : 我 们 是 否 可 以 使 用 算法 的 最 差 情况 运行 时 间 O(m’) 或 者 O(m”) 来 预测 性 能 ? 
答 : 不 可 以 ,因为 实际 运行 时 间 可 能 会 少 得 多 。 例 如 ， 函 数 30n*+10n+7 是 O(n”)), 但 也 


是 O(n) 和 O(n")， 因 为 大 O 表示 法 只 提供 最 差 情 况 运行 时 间 的 上 限 。 而 且 ， 即 使 存在 一 些 
输入 ， 其 运行 时 间 正 比 于 给 定 函数 ， 但 也 许 这 些 输入 在 实际 应 用 中 也 不 会 遇 到 。 因 此 ， 不 能 
使 用 大 O 表示 法 来 预测 性 能 。 我 们 使 用 的 波浪 线 表 示 法 和 增长 量 级 分 类 法 比 大 .O 表示 法 更 
精确 ， 因 为 它们 提供 了 与 函数 增长 量 级 匹配 的 上 限 和 下 限 。 许 多 程序 员 使 用 大 O 表示 法 指 
示 相 对 应 的 上 限 和 下 限 是 不 正确 的 。 


练习 


4.1.1 
4.1.2 


4.1.3 


为 ThreeSum (程序 4.1.1 ) 实现 静态 方法 printTriples()， 将 所 有 和 为 0 的 三 元 组 打印 到 标准 输出 。 
修改 ThreeSum， 使 其 接收 一 个 整数 命令 行 参数 target， 并 在 标准 输入 上 找 出 总 和 最 接近 target 
的 三 元 组 。 

编写 一 个 从 标准 输入 中 读 取 long 类 型 的 程序 FourSum， 并 统计 总 和 为 0 的 四 元 组 的 个 数 。 使 用 
四 重 嵌 套 循 环 。 请 问 程序 运行 时 间 的 增长 量 级 是 多 少 ?” 请 估计 程序 在 一 个 小 时 内 可 以 处 理 的 最 
大 的 输入 规模 n 为 多 少 。 然 后 ， 运 行程 序 来 验证 你 的 假设 。 

请 通过 归纳 法 证 明 0 到 n-1 之 间 的 所 有 (无 序 ) 整数 对 的 数量 为 n(n-1)/2， 然 后 使 用 归纳 法 证 
明 0 到 n-1 之 间 的 所 有 (无 序 ) 整数 三 元 组 的 数量 为 n(n-1)(n-2)/6。 

二 元 组 答案 : 这 个 公式 对 于 n=1 是 正确 的 ， 因 为 有 0 对 。 对 nn 二 1， 计算 不 包括 n-1 的 所 有 
数 对 ， 根 据 归纳 法 假设 个 数 是 (n-1)(n-2)/2， 计 算 含有 n-1 的 所 有 数 对 ， 就 是 n-1 个 ， 因 此 得 
到 二 元 组 个 数 为 

(n-1)(n-2)/2+(n-1)=n(n-1)/2 

三 元 组 答案 : 对 于 "=2， 公 式 成 立 。 对 于 na>2， 计 算 不 包括 n-1 的 所 有 三 元 组 ,根据 归纳 
法 假设 个 数 是 (n-1)(n-2)(n-3)/6， 计 算 含 有 n-l 的 所 有 数 对 ， 就 是 (n-1)(n-2)/2 个 ， 因 此 得 到 
三 元 组 个 数 为 

(n-1)(n-2)(n-3)/6+(n—1)(n-2)/2=n(n-1)(n-2)/6 
用 积分 近似 证 明 0 入 之 间 所 有 不 同 的 整数 三 元 组 数目 为 n3/6。 
答案 : B30) 1 二 JJ dk dj di = ffijqdi di = fa(i2/2) di=n3/6 
证 明 函 数 cm 的 log-log 图 斜率 为 了 »， 并且 x 轴 截 距 为 logc， 那 么 4ni(logn)? 的 斜率 和 x 轴 截 距 
是 多 少 ? 
运行 以 下 代码 片段 ，count 的 值 ( 作 为 n 的 一 个 函数 ) 是 多 少 ? 


long count = 0; 
for (Cint 1 = 0 1 < n; 1++) 
for (int j = 1 + jx ns) 
for (int k=j+ 1; k < ni k++) 
COunt++; 
答案 : n(n-1)(n-2)/6 
使 用 波浪 线 表示 法 简化 以 下 公式 ， 并 且 给 出 其 增长 量 级 : 
a. n(n—1)(n-2)(n-3)/24 b. (n-2)(lg n-2) (lg n+2) c. n(n+1)-n? 
d.n(nt+1)/2+n lgn e. In((n-1)(n-2)(n-3)) 
根据 标准 输入 的 整数 n 确定 ThreeSum 中 以 下 语句 运行 时 间 的 增长 量 级 : 


int[] a = StdIn.readAllInts(); 
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4.1.10 


4.1.11 


4.1.12 


4.1.13 


4.1.14 


4.1.15 


4.1.16 


4.1.17 
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答案 : 线性 。 运 行 时 间 的 瓶颈 是 隐 式 数组 初始 化 和 隐藏 在 readAllInts 中 的 输入 读 取 循环 。 
这 样 的 输入 循环 的 成 本 可 以 控制 在 线性 时 间 内 完成 ， 但 是 如 果 处 理 的 数据 量 非常 庞大 ， 甚 至 可 
能 会 需要 平方 级 的 时 间 成 本 。 
确定 下 面 的 代码 段 是 线性 型 、 二 次 型 还 是 三 次 型 (作为 n 的 函数 ) 的 增长 量 级 。 
tor (int T= "0 1 < nN, 1+t) 
forkCihtaj= "08 mM; jo) 
if (i == j) c[ij][j] = 1.0; 
else €[i] =°*0.0; 
假设 一 个 算法 基于 输入 大 小 为 1000、2000、3000 和 4000 的 运行 时 间 分 别 是 5 秒 、20 秒 、45 
秒 和 80 秒 。 请 估计 需要 多 长 时 间 才 能 解决 问题 规模 为 5000 的 问题 。 请 问 算法 是 线性 、 线 性 
对 数 、 二 次 、 三 次 还 是 指数 型 的 增长 量 级 ? 
你 更 喜欢 哪 种 算法 ， 增 长 量 级 是 二 次 、 线 性 对 数 还 是 线性 型 ? 
答案 : 虽然 很 容易 根据 增长 量 级 做 出 快速 选择 ， 但 这 样 选择 很 容易 被 误导 。 你 需要 了 解 
问题 的 规模 以 及 运行 时 间 的 首 项 系数 相对 值 的 大 小 。 例 如 ， 假 设 运行 时 间 为 到 秒 、100m log2n 
秒 和 10 000n 秒 。 小 于 或 等 于 1000 时 ， 二 次 型 算法 最 快 ; 线性 算法 永远 不 会 比 线性 对 数 算 
法 更 快 (n 必须 大 于 2” 时 线性 算法 会 更 快 ， 但 如 此 巨大 的 数 一 般 不 予 考 虑 )。 
应 用 科学 的 方法 分 析 下 面 的 代码 片段 (作为 参数 n 的 函数 ) 的 运行 时 间 的 增长 量 级 的 假设 ， 并 
验证 你 的 假设 : 


public static int fCint n) 


if (n == 0) return 1; 
¢ return f(n-1) + f(n-1); 
应 用 科学 的 方法 开发 和 验证 一 个 Coupon (程序 2.1.3 ) 中 collect() 方法 (作为 参数 nn 的 函数 ) 
的 运行 时 间 的 增长 量 级 的 假设 。 注 意 : 倍增 方法 对 于 区 分 线性 型 和 线性 对 数 型 无 效 ， 你 可 以 
尝试 将 输入 大 小 进行 平方 。 
应 用 科学 的 方法 开发 和 验证 Markov (程序 1.6.3 ) 运行 时 间 的 增长 量 级 的 假设 ， 它 应 该 是 实验 
次 数 trials 和 mn 的 函数 ， 而 trials 和 n 是 从 命令 行 参数 获得 的 。 
应 用 科学 的 方法 开发 和 验证 下 面 两 个 代码 片段 的 运行 时 间 的 增长 量 级 的 假设 ,它们 应 该 是 参 
数 n 的 函数 。 
SPing .Sm 
for Cint 1 =°0; 1 < n; i4+) 


if (StdRandom.bernoul1i(0.5)) s += "0"; 
else 8 Fn 


StringBuilder sb = new StringBuilder(); 
for Gint 1 0; 1 < Nn: ,it4) 
if (StdRandom.bernou11i(0.5)) sb.append("0"); 
else sb.append("1"); 
String s = sb.toString() ; 


如 下 四 个 Java 函数 均 返 回 一 个 长 度 为 n、 其 字符 均 为 x 的 字符 串 。 请 确定 每 个 函数 的 运行 时 间 
的 的 增长 量 级 。 回 顾 一 下 ， 在 Java 中 拼接 两 个 字符 串 需要 的 时 间 与 结果 字符 串 的 长 度 成 正比 。 
public static String methodi(int n) 


i 


if Cn == 0) return "" 
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String temp = methodl(n / 2); 
if (n % 2 == 0) return temp + temp; 


else return temp + temp + "x"; 


} 


public static String method2(int n) 
{ 
String s = ""; 
for (int i = 0; 1 < n; i++) 
人 半生 
return s; 
} 2 


+ 一 
1 


public static String method3(int n) 
{ 

if -Ch ==0) TetuFn 

if (Nn == 1) return, "x"; 

return method3(n/2) + method3(n - n/2); 
E 


public static String method4(Cint n) 
长 
char[] temp = new char[n]; 
for Cintiiei03 1 ens i444) 
temp[i] = 'x'; 
return new String(temp); 


} 


下 面 的 代码 片段 (改编 自 《 Java 程序 设 计 》 一 书 ) 创建 了 从 0 到 nn-1 之 间 整 数 的 一 个 随机 排 
列 。 请 确定 其 运行 时 间 的 增长 量 级 ， 它 应 该 是 的 函数 。 将 其 增长 量 级 与 1.4 节 中 混 排 代码 的 
增长 量 级 进行 比较 。 

int[] a = new int[n]; 

boolean[] taken = new boolean[n]; 


int count = 0; 
while (count < n) 


{ 
int r = StdRandom.uniformCn) ; 
if (!taken[r]) 
{ 
a[r] = count; 
taken[r] = true; 
Count++; 
} 
} 526 


以 下 两 个 函数 的 运行 时 间 的 增长 量 级 是 什么 ? 每 个 函数 都 将 一 个 字符 串 作 为 参数 ， 并 返回 该 
字符 串 的 逆序 。 


public static String reversel(String s) 
和 
int n = s.lengthO); 
String reverse = ""; 
和 OP Cint 1 = 0: 1 ,x ns 44+) 
reverse = Ss.charAt(i) + reverse; 
return reverse; 


} 


public static String reverse2(String s) 
{ 

int n = s.lengthO); 

if (n <= 1) return s; 
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4.1.21 


4.1.22 


4.1.23 
4.1.24 
4.1.25 


4.1.26 


4.1.27 
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String left = s.substring(0, n/2); 
String right = s.substring(n/2, n); 
return reverse2(right) + reverse2(left); 


} 


给 出 一 个 线性 时 间 算 法 来 输出 一 个 字符 串 的 逆序 。 
答案 : 
public static String reverse( 人 (String s) 
{ 

int n = s.lengthO); 

char[] a = new char[n]; 

for (int 1 = 0; i < ni i++) 

a[i] = s.charAt(n-i-1); 
return new String(a); 


} 


请 编写 一 个 程序 MooresLaw， 带 一 个 命令 行 参数 n， 如 果 处 理 器 的 速度 每 n 个 月 就 会 翻 一 倍 ， 
请 输出 十 年 后 处 理 器 的 速度 增长 了 多 少 。 如 果 速 度 每 n (=15 ) 个 月 增加 一 倍 ， 则 十 年 后 处 理 
器 的 速度 增加 了 多 少 ? 如 果 n=24 个 月 呢 ? 

请 使 用 正文 中 的 64 位 内 存 模型 ， 给 出 第 3 章 中 以 下 数据 类 型 的 每 个 对 象 的 内 存 需求 : 

a. Stopwatch b. Turtle Cc. Vector 

d. Body e. Universe 

请 估计 垂直 渗透 检测 (程序 2.4.2 ) 的 PercolationVisualizer (程序 2.4.3 ) 使 用 的 空间 总 量 ， 它 
应 该 是 网 格 大 小 n 的 函数 。 加 分 题 : 对 递归 渗透 检测 方法 (程序 2.4.5 ) 回答 同样 的 问题 。 

请 估计 你 的 计算 机 可 以 容纳 的 最 大 二 维 整数 数组 的 大 小 ， 然 后 尝试 分 配 这 样 一 个 数组 。 

请 估计 CompareDocuments( 程 序 3.3.5 ) 的 内 存 使 用 量 ， 它 应 该 是 文档 数量 n 和 维度 4 的 函数 。 
请 编写 PrimeSieve (程序 1.4.3 ) 的 一 个 版 本 ， 其 使 用 一 个 整数 数组 而 不 是 布尔 数组 ， 并 使 用 
每 字 节 中 的 所 有 位 ， 从 而 增 大 的 最 大 值 ， 使 得 程序 能 够 处 理 的 问题 可 以 增 大 8 售 。 

下 表 列 举 了 在 值 不 同时 三 个 程序 的 运行 时 间 。 根 据 所 提供 的 信息 ， 填 入 你 的 合理 估计 值 。 


程序 1000 10 000 100 000 1 000 000 
A 0.001s 0.012s 0.16s ? 
B 1 min 10 min 1.7h ? 
1s 1.7 min 2.8h ? 


请 给 出 每 个 程序 运行 时 间 的 增长 量 级 假设 。 
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4.1.28 


4.1.29 


4.1.30 


三 数 和 分 析 。 计 算 n 个 随机 32 位 整数 中 不 存在 总 和 为 0 的 三 元 组 的 概率 。 加 分 题 : 给 出 三 元 
组 的 期 望 个 数 的 近似 公式 (作为 n 的 函数 )， 并 运行 实验 来 验证 你 的 假设 。 

最 近 数 对 。 设 计 一 个 二 次 型 算法 ， 给 定 一 个 整数 数组 ， 找 出 数组 中 值 最 接近 的 一 对 数字 。( 在 
下 一 节 中 ， 你 将 被 要 求 为 这 个 问题 实现 一 个 线性 对 数 算法 。) 

beck 漏洞 攻击 。 假 设 有 一 个 流行 的 Web 服务 器 支持 一 个 函数 no2slash()， 其 目的 是 去 除 重 复 
的 字符 “/”。 人 例如， 字符 串 /d1///d2////d3/test.html 会 转换 为 /d1/d2/d3/test.html。 原 始 算法 是 
反复 查找 字符 “/” 并 复制 字符 串 的 其 余部 分 : 
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4.1.32 


4.1.33 


4.1.34 


4.1.35 


4.1.36 
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int n = name.length() ; 
i 电信- 六 中 
while (i < n) 


{ 
if ((c[i-1] == '/') && (c[i] == "/')) 
{ 


for(int, j, =.141; Jj <n; j++) 
c[j-1] = c[j]; 
hs 
} 
else i++; 


} 


遗憾 的 是 ， 上 述 代码 可 能 需要 二 次 级 时 间 (例如 ， 如 果 字 符 串 含有 重复 n 次 的 “/” 字 
符 )。 通 过 同时 发 送 大 量 包含 “/” 字 符 的 请 求 ， 黑 客 可 能 淹没 服务 器 ， 使 其 他 进程 无 法 获得 
足够 的 CPU 时 间 ， 从 而 造成 拒绝 服务 攻击 。 开 发 一 个 线性 时 间 运 行 的 no2slash() 版 本 ， 从 而 
有 效 防御 这 种 类 型 的 攻击 。 

子 集 和 。 请 编写 一 个 从 标准 输入 中 读 取 长 整 型 的 程序 SubsetSum， 用 于 统计 那些 总 和 恰好 为 0 
的 整数 子 集 数目 。 给 出 程序 运行 时 间 的 增长 量 级 。 

杨 氏 答 阵 。 假 设 存 在 一 个 二 X5 的 二 维 整数 数组 a[][]， 对 于 所 有 的 i 和 j， 满足 a[ 门 站 <a[i+1]D] 
和 <0]D]<aD]IFH，5X5 数 组 如 下 所 示 。 


具有 这 个 属性 的 二 维 数组 被 称 为 声 民 给 阵 。 请 编写 一 个 函数 ， 该 函数 将 一 个 五 X 却 的 杨 氏 
和 矩阵 和 一 个 整数 作为 参数 ， 并 确定 该 整数 是 否 在 杨 氏 和 矩阵 中 。 函 数 运行 时 间 的 增长 量 级 应 该 
与 n 旦 线性 关系 。 
数组 旋转 。 给 定 一 个 包含 个 元 素 的 数组 ， 请 给 出 一 个 线性 时 间 算 法 ， 用 于 旋转 数组 的 天 个 
位 置 。 也 就 是 说 ， 如 果 数 组 包含 n 个 元 素 ao,a1,…,as-i1， 则 旋转 后 的 数组 为 weak aa-ibao… 
aele 最 多 使 用 一 个 常量 大 小 的 额外 空间 。 提 示 : 反 转 三 个 子 数组 。 
查找 重复 的 整数 。( a) 给 定 包 含 n 个 整数 (1 到 nn) 的 数组 ， 其 中 一 个 整数 重复 两 次 ， 一 个 整 
数 缺 失 ， 请 给 出 一 个 算法 ， 使 用 线性 时 间 和 常量 额外 内 存 找到 缺失 的 整数 。 不 考虑 整数 溢出 。 
(b) 给 定 一 个 包含 nn 个 整数 的 只 读数 组 ， 其 中 1 到 -1 的 每 个 值 只 出 现 一 次 ， 有 一 个 整数 出 
现 了 两 次 ， 请 给 出 一 个 算法 ， 使 用 线性 时 间 和 常量 额外 内 存 找到 重复 的 整数 。( c) 给 定 一 个 包 
含 n 个 整数 (1 到 nn-1) 的 只 读数 组 ， 请 给 出 一 个 算法 ， 使 用 线性 时 间 和 常量 额外 内 存 查找 重 
复 值 。 
阶 磁 。 请 设计 一 个 快速 算法 用 于 计算 为 很 大 值 时 的 n!， 使 用 Java 的 BigInteger 类 。 使 用 你 
的 程序 计算 1 000 000! 中 最 多 有 多 少 个 连续 的 9。 为 你 的 算法 运行 时 间 的 增长 量 级 提出 一 个 假 
设 并 验证 。 
最 大 和 。 设 计 一 个 线性 时 间 算 法 ， 用 于 在 包含 ”个 长 整 型 的 数组 中 找到 最 大 m 个 数 的 连续 子 
数组 ， 使 得 这 个 子 数组 在 所 有 这 样 的 子 数组 中 相 加 和 最 大 。 请 实现 你 的 算法 ， 并 确保 程序 运 
行 时 间 的 增长 量 级 是 线性 的 。 
最 大 平均 值 。 请 编写 一 个 程序 ,在 包含 个 长 整 型 的 数组 中 查找 最 多 m 个 元 素 的 连续 子 数组 ， 
使 其 平均 值 在 所 有 这 样 的 子 数组 中 最 大 。 使 用 科学 的 方法 证 明 程 序 运行 时 间 的 增长 量 级 为 
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mn*。 接 下 来 ,请 编写 一 个 程序 解决 如 下 问题 ， 首 先 对 于 每 个 i 计算 prefix[ 计 =a[0]+...+a[ 丫 ， 然 
后 使 用 表达 式 (prefix[ 门 -prefix[i])/0-i+1) 计算 区 间 ali] 到 a[j] 的 平均 值 。 请 使 用 科学 的 方法 来 
证 明 这 种 方法 把 增长 量 级 减少 了 nn 售 。 

4.1.38 模式 匹配 。 给 定 由 黑色 (1) 和 白色 (0) 像素 组 成 的 nXn 数组 ,请 设计 一 个 线性 时 间 的 算 
法 ， 查 找 不 包含 白色 像素 的 最 大 方形 子 矩阵 。 在 下 面 的 例子 中 ， 最 大 的 黑色 像素 子 和 矩阵 是 用 
浅 色 显 示 的 3X3 的 子 和 矩阵 。 

10111000 
00010100 
00111000 
00111010 
00111111 
01011110 
01011010 
00011110 


请 实现 你 的 算法 ， 并 确保 其 运行 时 间 的 增长 量 级 与 像素 数量 呈 线 性 关系 。 加 分 题 : 请 设计 
一 个 算法 来 找到 最 大 拢 形 黑色 子 和 矩阵 。 
4.1.39 次 指数 函数 。 请 查找 一 个 函数 ， 其 运行 时 间 的 增长 量 级 比 多 项 式 函数 大 ,但 比 指数 函数 小 。 
加 分 题 : 请 编写 一 个 程序 ， 其 运行 时 间 是 这 种 增长 量 级 的 。 


4.2 排序 和 搜索 


排序 问题 旨 在 将 数组 中 的 元 素 重新 排列 成 升序 。 在 许多 计算 和 应 用 中 ， 这 是 一 个 常用 且 
关键 的 任务 : 音乐 库 中 的 歌曲 按 字 母 顺序 排列 ; 电子 邮件 按 接 收 时 间 的 相反 顺序 显示 等 。 把 
事物 按 某 种 顺序 排列 是 一 种 很 自然 的 需求 。 排 序 非常 有 用 的 一 个 理由 是 ， 在 排序 的 列表 中 搜 
索 某 些 内 容 ， 要 比 在 未 排序 的 列表 中 容易 得 多 。 这 种 需求 在 计算 中 尤为 突出 ， 因 为 计算 中 要 
搜索 的 数组 可 能 十 分 巨大 ， 而 高 效 的 搜索 可 能 是 一 个 问题 解决 方案 中 的 关键 因素 。 

排序 和 查找 对 于 商业 应 用 程序 (企业 按照 顺序 存储 客户 文件 ) 和 科学 应 用 程序 (组织 数 
据 和 计算 ) 非常 重要 ， 并 且 在 其 他 可 能 看 似 与 事物 排序 无 关 的 领域 中 也 有 各 种 应 用 ,包括 数 
据 压 缩 、 计 算 机 图 形 学 、 生 物 信息 党、 数值 计算 、 组 合 优化 、 密 码 学 等 。 

我 们 使 用 这 些 基本 问题 来 阐述 一 个 观念 ， 那 就 是 高 效 的 算法 是 计算 问题 的 有 效 解决 方案 
的 关键 之 一 。 事 实 上 ， 科 学 家 已 经 提出 了 许多 不 同 的 排序 和 查找 方法 =。 解决 一 个 具体 任务 时 ， 
我 们 应 该 选择 哪 种 算法 呢 ? 这 是 一 个 非常 重要 的 问题 ， 因 为 不 同 的 算法 在 性 能 上 有 显著 的 差 
异 ， 从 而 导致 成 功 解决 实际 问题 还 是 根本 无 法 解决 实际 问题 的 差别 (即使 使 用 最 快 的 计算 机 )。 

在 本 节 中 ， 我 们 将 详细 讨论 用 于 查找 和 排序 的 两 个 经 典 算法 一 一 二 分 查找 和 归并 排序 ， 
以 及 若干 侧重 效率 的 应 用 程序 。 通 过 这 些 例子 ， 你 会 意识 到 ， 在 解决 需要 大 量 计算 的 问题 
时 ,不 仅仅 需要 注重 方法 的 有 效 性 ， 还 需要 注意 运行 成 本 。 

二 分 查找 法 “20 个 问题 ”的 游戏 ( 见 程 序 1.5.2 ) 为 计算 问题 设计 高 效 算法 提供 了 一 个 
重要 并 且 有 用 的 思路 。 规 则 十 分 很 简单 : 你 的 任务 是 猜测 一 个 神秘 整数 的 值 ， 它 在 0 到 z-1 
这 个 整数 之 中 。 每 次 你 做 出 一 个 猜测 时 ， 程 序 会 告知 猜测 的 值 等 于 、 大 于 或 者 小 于 那个 神 
秘 数字 。 为 了 阐述 得 更 加 清楚 ， 我 们 首先 稍微 修改 一 下 游戏 的 提问 形式 :“ 请 问 该 数 大 于 或 
等 于 工 吗 ?”， 其 答案 仅 为 true 或 false, 假设 n 是 2 的 整数 次 寡 。 

正如 在 1.5 节 中 所 述 ， 对 于 这 个 问题 最 有 效 的 策略 是 不 断 维 护 和 修正 包含 秘密 数字 的 区 
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间 。 在 每 个 步骤 中 ， 都 可 以 通过 提问 将 区 间 的 大 小 缩小 一 半 。 具 体 来 说 ,我 们 猜测 在 数值 区 
间 中 间 的 那个 数字 ， 根 据 猜 测 结果 把 包含 秘密 数字 的 区 间 减 半 。 更 准确 地 说 ,我 们 使 用 一 个 
半 开 区 间 ， 半 开 区 间 包 含 左 端 点 但 不 包含 右 端 


点 。 我 们 使 用 符号 [lo 


，hi) 来 表示 所 有 大 于 等 于 


lo 但 小 于 (不 等 于 ) hi 的 整数 。 开 始 时 10=0、 
hi=n， 使 用 如 下 递归 策略 : 
。 基础 步骤 : 如 果 hi-lo=1， 那 么 秘密 数字 


是 108 


。 归纳 步 又 : 否则 ,询问 秘密 数字 是 否 大 
于 或 等 于 中 间 数 mid=lo+(hi-lo)/2。 如 果 
是 ， 则 继续 在 区 间 [mid，hi) 中 查找 ; 否 
则 在 [lo，mid) 中 查找 。 


程序 Questions ( 


程序 4.2.1) 中 的 binary- 


Search() 函数 是 该 策略 的 一 个 实现 。 这 种 策略 是 
二 分 查找 的 通用 问题 求解 算法 的 例子 ， 二 分 查 


找 法 具有 广泛 的 应 用 。 









{ 
{ 


} 






{ 


} 
} 





Greater 
Greater 
Greater 
Greater 
Greater 
Greater 
Greater 


程序 4.2.1 


public class Questions 


% java Questions 7 
Think of a number between 0 and 127 


Your number is 77 


二 分 查找 法 (20 个 问题 游戏 ) 


public static int binarySearch(int lo, int hi) 


# 在 [10, ti 区 间 中 找 数 字 
if (hi - 1o == 1) return 1o; 
int mid = 10o + (hi - 10) / 2; 


StdOut.print("Greater than or equal to " 


if (StdIn.readBoolean()) 

return binarySearch(1o, mid); 
else 

return binarySearch(mid, hi); 


public static void main(String[] args) 


从 开始 20 个 问题 的 游戏 


int k = Integer.parseInt(args[0]); 


int n = (int) Math.pow(2，k); 


StdOut.print("Think of a number 
StdOut.printlin("between 0 and "+ (n-1)); 


int guess = binarySearch(0, n); 


StdOut.println("Your number is " 


这 上段 代码 使 用 二 分 查找 法 实现 与 程序 1.5.2 相 同 功 能 的 游戏 程序 ， 但 角色 
相反 : 由 用 户 选 择 一 个 秘密 数字 ,程序 猜测 其 值 。 程 序 带 一 个 整数 型 命令 行 参 
和 其 中 n=2:， 然 后 用 k 次 提问 猜 出 
正 a 


than or equal to 64? false 
than or equal to 967 
than or equal to 80? 
than or equal to 727 
than or equal to 76? 
than or equal to 787? 
than or equal to 777? 


); 


区 间 

0 128 
0 64 128 
Bm 
0 64 80 

0 72 80 

0 76 80 

0 7678 












+ Wid Hi? 75 


lo | 可 能 的 最 小 值 

























ni - 1| 可 能 的 最 大 值 
mid 中 点 
k 提问 的 数量 
n 可 选 值 的 数量 


+ guess); 





长 度 


Ei 


1 


3 


A 


:true 


false 


false 


true 


true 


false 


true 


算法 正确 性 证 明 。 首 先 ， 我 们 必须 证 明 算 法 的 正确 性 : 结果 总 能 引 向 那个 秘密 的 数字 。 
我 们 通过 如 下 事实 加 以 证 明 : 
。 区间 始终 包含 秘密 数字 。 
。 区间 大 小 是 2 的 整数 次 备 ， 从 n 开始 递减 。 
第 一 条 事实 由 代码 保证 其 正确 性 ; 第 二 条 事实 指出 ， 如 果 (hi-lo) 是 2 的 宕 ， 则 (hi-lo) /2 
是 下 一 个 较 小 的 2 的 究 ， 并 且 得 到 两 个 减 半 的 区 间 [lo，mid) 和 [mid，hi)。 这 些 事实 是 利 
用 归纳 法 证 明 算法 操作 正确 性 的 基础 。 最 终 ， 区 间 的 长 度 缩短 为 1， 所 以 我 们 可 以 保证 查找 
到 结果 。 
运行 时 间 分 析 。 假 设 n 是 可 能 值 的 个 数 。 在 程序 4.2.1 中 ,我 们 有 n=2*， 其 中 态 ]gn。 
现在 假设 7(n) 是 问题 提问 的 次 数 。 递 归 策 略 意味 着 T(n) 必须 满足 以 下 递 推 关 系 式 : 
T(n)=T(n/2)+1 
当 n=1 时 ，7T(1)=0。 把 nn 替换 为 2*， 通 过 在 这 个 式 子 上 不 断 循环 可 以 得 到 如 下 闭 表 
达 式 : 
T(2)=7T(2™")+1=7T(2"?)+2=*…=T(1)+h=k 
把 2° 替换 为 n (并 且 上 蔡 换 为 lgn) 得 到 结果 : 
T(n)=lgn 
上 述 公式 证 明了 我 们 的 假设 ,使 用 三 分 查找 算法 的 运行 时 间 是 对 数 型 。 请 注意 : 即使 
不 是 2 的 窒 ， 二 分 查找 算法 和 TwentyQuestions.binarySearch() 也 同样 适用 。 我 们 假设 n 是 2 
的 究 只 是 为 了 简化 证 明 的 过 程 (参见 练习 4.2.1 )。 
线性 - 对 数 之 间 的 渔 沟 。 使 用 二 分 查找 法 的 一 种 替代 方法 是 先 猜测 0， 然 后 是 1、2、3， 
以 此 类 推 ， 直 到 找到 那个 秘密 数字 。 我 们 称 这 个 算法 为 顺序 搜索 。 这 是 一 个 暴力 算法 的 例 
子 ， 虽 然 可 以 完成 任务 ， 但 没有 考虑 成 本 。 顺 序 搜索 的 运行 时 间 与 秘密 数字 相关 : 如 果 秘 密 
数字 为 0， 顺序 搜索 只 需要 1 步 ， 但 如 果 秘 密 数 字 是 n-1; 顺序 搜索 则 需要 n 步 。 如 果 随 机 
选择 数字 ， 预 期 的 步 数 为 n/2。 同 时 ， 二 分 查找 算法 保证 最 多 提出 lgn 个 问题 。n 和 lgn 在 实 
535] 际 应 用 中 的 差异 是 巨大 的 。 理 解 这 种 巨大 的 差异 是 理解 算法 设计 和 分 析 重 要 性 的 关键 步骤 。 
在 当前 例子 中 ,假设 处 理 一 个 问题 需要 1 秒 。 通 过 三 分 查找 算法 ， 你 可 以 在 20 秒 内 猜 出 任 
何 一 个 小 于 100 万 的 数字 ; 而 使 用 顺序 搜索 的 暴力 算法 ， 可 能 需要 100 万 秒 ， 超 过 一 个 星期 
的 时 间 。 我 们 将 看 到 ， 在 许多 例子 中 ， 这 种 运行 成 本 的 差异 会 成 为 是 否 可 以 有 效 解决 实际 问 
题 的 决定 因素 。 
二 进 制 表 示 。 如 果 我 们 重新 回顾 程序 1.3.7; 就 会 立即 发 现 二 分 查找 算法 几乎 等 同 于 将 
一 个 数字 转换 成 二 进 制 的 计算 方法 ! 每 个 问题 确定 答案 的 一 个 二 进 制 位 。 在 我 们 的 例子 中 ， 
数字 位 于 0 到 127 之 间 的 信息 意味 着 其 二 进 制 表 示 的 位 数 为 7， 第 一 个 问题 (这 个 数字 是 否 
大 于 或 等 于 64 ? ) 的 答案 告诉 我 们 第 一 个 二 进 制 位 的 值 ， 第 二 个 问题 的 答案 告诉 我 们 下 一 个 
二 进 制 位 的 值 ， 以 此 类 推 。 例 如 ， 如 果 数 值 是 77， 那 么 答案 序列 依次 为 “ 否 是 是 否 否 是 否 ”， 
可 得 出 1001101， 即 77 的 三 进 制 表示 。 使 用 三 进 制 表 示 法 思考 问题 有 助 于 理解 对 数 - 线性 
鸿沟 : 当 程 序 的 运行 时 间 为 参数 n 的 线性 函数 时 ， 其 运行 时 间 与 的 值 成 正比 ， 然 而 ， 对 数 
运行 时 间 仅 仅 与 于 的 二 进 制 位 数 成 正比 。 换 一 种 也 许 你 更 熟悉 的 场景 ， 请 考虑 下 面 这 个 问 
题 : 你 是 想 挣 6 美元 还 是 6 位 数 的 薪水 呢 ? 
求 反 函 数 。 作 为 二 分 查找 法 在 科学 计算 中 的 一 个 应 用 实例 ,我们 重新 回顾 计算 递增 函 
[536] 数 flx) 的 反 函 数 的 问题 。 给 定 一 个 值 >， 我 们 的 任务 是 找到 一 个 值 Y， 使 得 /Ko)=y。 在 这 种 
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情况 下 ， 我 们 使 用 实数 而 不 是 整数 作为 区 间 的 端点 ， 但 使 用 与 猜测 秘密 数字 相同 的 算法 : 每 
一 步 把 区 间 长 度 减 半 ， 并 确保 x 在 区 间 中 ， 直 到 






大 (hi 
区 间 足 够 小 ， 此 时 值 x 位 于 期 望 的 精度 5 内 。 我 flmid) 
们 从 包含 x 的 区 间 (lo,hi) 开始 ， 使 用 如 下 递归 
策略 : y=f(%) 
4 > 
。 计算 中 间 值 mid=lo+(hi-10)/2。 ) 在 函数 /lo 和 f (0) 
。 基 础 步骤 如果 hi-lo<65， 则 返回 mid 作 J" 


为 x 的 估计 值 。 
。 归纳 步骤 : 否则 ， 测 试 ftmid)>y 是 否 成 立 。 
如 果 成 立 ， 在 (lo, mid) 中 查找 x; 否则 在 
5 玉 的 值 在 lo 和 mid 之 间 
为 了 解决 这 个 问题 ， 程 序 4.2.2 计算 了 高 斯 
累积 分 布 函数 下 的 反 男 数 ， 我 们 在 Gaussian ( 程 使 用 二 分 查找 法 求 一 个 递增 函数 的 反 函 数 
序 2.1.2 ) 中 实现 了 这 个 函数 。 





lox mid hi 


程序 4.2.2 ”二 分 查找 法 





public static double inverseCDF(double y) 
{ return bisectionSearch(y, 0.00000001, -8, 8); } 


private static double bisectionSearch(double y, double delta, 
double lo, double hi) 

{J/ 计算 出 cdf(X)=y 时 x 的 值 

double mid = lo + (hi - 10)/2; y 参数 

光 (hi - lo < delta) return mid; delta | 求解 精度 

if (cdf(mid) > y) 1 可 能 的 最 小 

return bisectionSearchCy，delta，1o，mid); 请 es ] 最 小 什 

else 9 
return bisectionSearch(y, delta, mid, hi); hi 可 能 的 最 大 值 


对 于 我 们 的 高 斯 函数 库 ( 程序 2.1.2) ，inyerseCDFO 函 数 使 用 二 分 查找 
算法 计算 一 个 点 rx， 使 得 B(x) 等 于 给 定 值 y ( 误差 精度 为 给 定 的 delta ).。 它 
是 一 个 递归 盯 数 ， 每 次 将 包含 点 xz 的 区 间 长 度 减 半 守 求解 位 于 区 间 申 点 的 函数 
值 ,- 并 利用 多 是 递增 函数 的 性 质 ， 判 断 所 期 望 的 点 x 位 于 左 半 区 间 还 是 右 半 区 间 ， 
重复 上 述 过 程 直 到 区 间 的 长 度 小 于 给 定 的 精度 。 





这 个 方法 的 关键 在 于 函数 是 递增 函数 ， 即 对 于 任何 值 a 和 5b， 如果 fa)<ftb)， 则 a<b， 
反之 亦 然 。 递 归 步 又 仅仅 运用 了 以 下 知识 : 如 果 已 知 y=ftx)<ftmid)， 则 x<mid， 所 以 x 一 定 
位 于 区 间 (1o, mid) 中 ， 如 果 已 知 y=fX)>fmid)， 则 x>mid， 所 以 x 一 定位 于 区 间 (mid, hi) 
中 。 这 个 问题 可 以 被 视 为 确定 区 间 (lo, hi) 的 n(n=(hi-l0)/6) 个 长 度 为 5 的 小 区 间 中 ， 哪 一 
个 区 间 包 含 x， 其 运行 时 间 是 n 的 对 数 。 与 把 一 个 整数 转换 为 二 进 制 一 样 ， 我 们 每 次 迭代 确 
定 x 的 一 个 位 。 在 这 种 情况 下 ， 二 分 查找 通常 称 为 折 半 查找 (bisection search)， 因 为 每 一 步 
我 们 都 把 区 间 一 分 为 二 。 

在 排 好 序 的 数组 中 使 用 二 分 查找 法 。 二 分 查找 法 最 重要 的 应 用 之 一 是 使 用 一 个 关键 字 
查找 信息 。 这 种 用 法 在 现代 计算 中 无 处 不 在 ， 而 依赖 于 相同 概念 的 出 版 物 正在 走向 消亡 。 
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例如 ， 在 过 去 的 几 个 世纪 里 ， 人 们 使 用 一 个 称 为 字典 的 出 版 物 来 查找 单词 的 定义 。 在 20 世 
纪 的 大 部 分 时 间 里 ， 人 们 使 用 称 为 电话 短 的 出 版 物 来 
查找 一 个 人 的 电话 号 码 。 在 这 两 种 情形 中 ， 其 基本 机 
制 都 是 相同 的 : 所 有 的 项 目 按 顺序 排列 ， 通 过 可 标识 
项 目的 关键 字 排 序 (例如 字典 中 的 单词 、 电 话 德 中 的 
姓名 ， 它 们 都 按 字母 顺序 排列 )。 你 现在 也 许 会 使 用 计 
算 机 来 查找 这 些 信息 ， 但 是 否 考虑 过 如 何在 一 本 字典 mid 
中 查找 一 个 单词 ? 一 种 方法 是 顺序 搜索 ， 这 是 一 种 暴 “定名 全 之 加 
力 算法 ， 从 头 开始 依次 检查 每 个 元 素 ， 直 到 找到 该 单 
词 。 没 有 人 会 使 用 这 种 算法 。 替 代 方 法 是 打开 书 中 间 ”索引 值 (未 知 值 ) 处 一 ? 
的 某 一 页 ， 在 该 页 中 查找 该 单词 。 如 果 查 到 则 完成 任 "客站 
务 ， 和 否则， 继续 在 本 页 前 面 的 一 半 或 本 页 后 面 的 一 半 
中 重复 上 述 查 找 过 程 。 我 们 现在 认识 到 这 种 方法 就 是 
538] 二 分 查找 法 (程序 4.2.3 )。 在 排 好 序 的 数组 中 使 用 二 分 查找 法 (一 步 ) 

















程序 4.2.3 二 分 查找 ( 在 一 个 排 好 序 的 数组 中 ) 





public class BinarySearch 


public static int search(String key, String[] a) 
{ return search(key, a, 0, a.length); } 


public static int search(String key, String[] a, int 1o, int hi) 
{ /W 在 aLlo, hi) 区 间 中 查找 键 值 

if (hi <= 10) return -1; 

int mid = lo + (hi - 10) / 2; 

int cmp = a[mid] .compareTo(key); 


if (cmp > 0) return search(key, a, 1o, mid); 
else if (cmp < 0) return search(key, a, mid+1, hi); 
else return mid; 


} 

public static void main(String[] args) key 查找 关键 字 

{ VW 从 标准 输入 获得 键 值 ， 如 果 键 值 没有 出 现在 “a[lo, hi) | 已 排序 的 子 数 组 
//args[0] 指 定 的 文件 中 ， 那 么 就 把 它 打 印 出 来 1o 最 小 索引 | 

In in = new In(args[0]); mid 中 间 索 引 

String[] a = in.readAllStrings(); 

while (!StdIn.isEmptyO) 最 大 索引 

{ 



































String key = StdIn.readStringQO); 
if (search(key, a) < 0) StdOut.printin(key); 





该 类 中 的 search( 方 法 使 用 二 分 查找 法 查找 一 个 位 于 排 好 序 的 数组 中 字符 串 key 
的 索引 (如果 关键 字 不 在 数组 中 ,， 则 返回 -1.) 。 测试 客户 程序 是 一 个 异常 过 
滤器 ， 从 一 个 命令 行 参数 指定 的 文件 中 读 取 一 个 已 排序 的 字符 串 数组 ( 白 名 单 
列表 ) ， 然 后 从 标准 输入 获取 一 系列 单词 并 输出 不 包含 在 白 名 单 中 的 单词 。 








% more emails.txt % more whitelist.txt 





bob@office alic 

carl@beach bob@office 

marvin@spam carl@beach 

bob@office dave@boat 

bob@office 

mallory@spam % java BinarySearch whitelist.txt < emails.txt 
dave@boat marvin@spam 

eve@airport mallory@spam 

alice@home eve@airport 
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异常 过 滤器 。 我 们 将 在 4.3 节 中 详细 讨论 实现 替代 字典 或 电话 短 的 计算 机 程序 。 程 序 
4.2.3 使 用 三 分 查找 法 解决 一 个 简单 的 问题 : 一 个 给 定 的 关键 字 是 否 存在 于 一 个 排 好 序 的 关 
键 字数 组 中 。 例 如 ， 当 检查 一 个 单词 的 拼写 时 ， 只 需要 知道 单词 是 否 在 字典 中 ， 而 对 单词 的 
含义 不 感 兴趣 。 在 计算 机 搜索 中 ,我 们 把 信息 保存 在 一 个 数组 中 ， 并 按 关键 字 排序 (对 于 某 
些 应 用 程序 ， 其 信息 已 经 按 顺 序 排列 ; 对 于 其 他 程序 中 的 信息 ， 我 们 必须 先 使 用 本 节 随 后 讨 
论 的 算法 对 其 进行 排序 )。 

程序 4.2.3 中 的 二 分 查找 算法 与 其 他 应 用 程序 的 区 别 主要 有 如 下 两 点 。 首 先 ， 数 组 长 度 
n 不必 是 2 的 寡 。 其 次 ， 它 必须 考虑 到 所 寻求 的 关键 字 可 能 不 在 数组 中 。 当 使 用 二 进 制 编码 
来 解释 搜索 过 程 时 需要 谨慎 处 理 这 些 细节 ， 我 们 在 本 节 的 问答 环节 和 练习 中 进行 讨论 。 

程序 4.2.3 中 的 测试 客户 程序 被 称 为 异常 过 滤器 : 它 从 一 个 文件 读 取 一 个 有 序 的 字符 串 
数组 (我 们 称 之 为 白 名 单 )， 并 从 标准 输入 中 读 取 任 意 字符 串 序 列 ， 然 后 输出 不 在 白 名 单 中 
的 字符 串 。 异 常 过 滤器 具有 很 多 直接 的 应 用 。 例 如 ， 如 果 白 名 单 是 字典 中 的 单词 ， 而 标准 输 
和 人 是 一 个 文本 文档 ， 则 异常 过 滤器 会 输出 拼写 错误 的 单词 。 另 一 个 例子 来 自 Web 应 用 程序 : 
电子 邮件 应 用 程序 可 能 会 使 用 异常 过 滤器 来 拒 收 任何 不 在 白 名 单 (包含 你 所 有 朋友 的 电子 邮 
件 地 址 ) 中 的 电子 邮件 。 或 者 ， 操 作 系 统 可 能 使 用 异常 过 滤器 禁止 不 在 预先 批准 的 IP 地 址 
白 名 单 上 的 设备 连接 到 你 的 计算 机 。 

物体 称 重 法 。 二 分 查找 法 自古 以 来 就 被 人 们 所 熟知 ， 也 许 部 分 原因 是 以 下 应 用 场景 。 假 
设 需要 仅 使 用 一 个 天 平和 一 些 硅 码 来 确定 一 个 物体 的 质量 。 使 用 二 分 查找 ， 可 以 使 用 质量 为 
2 的 索 的 硅 码 (每 个 硅 码 只 需要 一 个 ) 做 到 这 一 点 。 把 物体 放 在 天 平 的 右 侧 ， 左 侧 按照 降序 放 
上 不 同 质量 的 硅 码 。 如 果 一 个 硅 码 导致 天 平 向 左倾 斜 ， 则 取出 该 硅 码 ; 否则 ,保留 该 碎 码 继续 
尝试 。 这 个 过 程 等 价 于 通过 递减 2 的 寡 的 方法 确定 数字 的 二 进 制 表示 ,如 程序 1.3.7 中 所 示 。 


20 个 问题 游戏 


(将 整数 转换 成 二 进 制 ) 物体 称 重 求 函数 的 反 函 数 


人 GB(hi) 
小 于 64+16 二 wy 
100???? ai 
1001??? >72 
和 \ 大 于 64+8 


二 分 查找 法 的 三 个 应 用 
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64 - 
10011?? 
八大 于 64+8+4 
党 于 64+8+4+2 间 EE 减少 chi 
100110? 到 此 
等 于 6448+4+2+1 
* | 和 li, 区 B(x) 
1001101 ee Se eee , 


二 分 查找 法 的 三 个 应 用 ( 续 ) 


快速 算法 是 现代 世界 的 基本 要 素 ， 三 分 查找 法 是 描述 快速 算法 应 用 效果 的 典型 示例 。 通 
过 一 些 简单 的 计算 你 将 发 现 ， 对 于 使 用 异常 过 滤器 在 文档 中 查找 所 有 拼写 错误 的 单词 或 保护 
计算 机 免 遭 入 侵 之 类 的 问题 ， 你 都 需要 一 个 类 似 于 二 分 查找 法 的 快速 算法 。 花 时 间 实 现 这 
样 的 快速 算法 ， 可 以 瞬间 完成 对 一 个 百 万 单词 文件 的 拼写 检查 ， 白 名 单 也 可 以 包含 数 百 万 单 
词 ， 而 使 用 暴力 算法 则 可 能 需要 几 天 或 几 周 的 时 间 。 如 今 ， 互 联网 公司 日 常 提供 的 服务 一 般 
基于 二 分 查找 算法 ， 对 于 在 包含 数 十 亿 元 素 的 数组 中 实施 数 十 亿 次 的 查找 操作 ， 如 果 没 有 类 
似 二 分 查找 的 快速 算法 ,我 们 无 法 提供 这 样 的 服务 。 

无 论 是 大 量 的 实验 数据 还 是 对 物理 世界 某 些 方面 的 具体 表示 ， 现 代 科学 家 都 被 淹没 在 大 
量 的 数据 之 中 。 二 分 查找 法 和 类 似 的 快速 算法 是 科学 进步 的 重要 组 成 部 分 。 使 用 暴力 算法 恰 
好 类 似 于 从 第 一 页 开始 逐 页 查找 字典 中 的 单词 。 使 用 快速 算法 ， 你 可 以 在 瞬间 搜索 数 十 亿 条 
信息 。 投 入 一 些 时 间 和 精力 来 确定 和 使 用 这 样 一 个 快速 的 搜索 算法 ， 可 以 看 出 快速 算法 与 暴 
力 算 法 在 问题 的 难 易 程 度 和 花费 资源 的 大 小 上 的 不 同 ， 甚 至 暴力 算法 可 能 根本 无 法 解决 你 的 
问题 。 

插入 排序 算法 ”二 分 查找 法 要 求 数组 必须 是 排 好 序 的 ， 排 序 还 有 许多 其 他 直接 的 应 用 ， 
所 以 我 们 接 下 来 讨论 排序 算法 。 我 们 首先 讨论 暴力 算法 ， 然 后 讨论 可 以 应 用 于 大 型 数组 的 复 
杂 算 法 。 

我 们 讨论 的 暴力 算法 称 为 插入 排序 算法 ,该 算法 基于 人 们 用 来 排列 一 手 扑克 的 基本 
方法 ， 即 每 次 处 理 一 张 牌 ， 然 后 将 它 揪 天 已 经 排 好 序 的 扑克 牌 中 ， 使 它们 保持 按 序 排列 。 
以 下 代码 是 在 Java 中 模拟 这 一 过 程 ， 该 方法 可 以 重新 排列 数组 中 的 字符 串 ， 使 其 按 升序 
排列 : 


public static void sort(String[] a) 








int-n = a.length; 
for (int i = 1; i < ni it+) 
for (int j = 1; j > 0; j--) 
if (a[j-1].compareTo(a[j]) > 0) 
exchange(a, j-1, j); 
else break; 
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外 层 循环 的 每 次 循环 开始 时 ， 数 组 中 的 前 i 个 元 素 是 按 顺 序 排列 的 ， 内 层 循环 将 a[ 订 移 
动 到 数组 中 的 正确 位 置 ， 如 下 面 的 示例 中 ， 当 i 是 6 时 : 


al] 








0 1 2 4 5 6 7 
6 6 and had him his was you the but 
6 和 and had him his Was the you but 
6 4 and had him his the Was you but 


and had him his the was you but 


通过 将 a[6] 与 左边 更 大 的 数字 交换 ， 使 a[6] 被 插入 数组 中 合适 的 位 置 


具体 来 说 ,通过 与 左边 较 大 元 素 的 交换 操作 (使 用 2.1 节 中 实现 的 exchange() 函数 )， 元 
素 afi] 被 依次 移动 插入 其 左 侧 已 排序 元 素 的 前 面 ， 逐 一 从 右 向 左 移动 ， 直 到 元 素 到 达 合 适 的 
位 置 。 表 格 中 展示 的 三 行 就 是 程序 运行 时 的 跟踪 信息 ， 注 意 黑色 的 元 素 就 是 用 于 比较 的 元 素 。 
上 述 插 入 过 程 首先 针对 i 等 于 1 的 情况 执行 ， 然 后 i 等 于 2、3， 详 细 的 跟踪 信息 如 下 所 示 。 


al] 








No a pWNND 十 
~ DW poOorr-o 
名 
3 
总 
了 
多 
a 
和 
A 
寻 
蕊 
多 
nn 
完 
= 
on 
ot 
人 0D 
可 
加 
a 


and but had him his the was you 
插入 排序 的 跟踪 信息 (将 a[1] 一 a[n=-1] 插入 合适 位 置 ) 


跟踪 信息 显示 了 每 次 外 层 的 for 循环 完成 后 的 数组 内 容 ， 以 及 这 个 时 间 点 j 的 值 。 加 阴 
影 显示 的 元 素 是 循环 开始 时 ali] 的 值 ， 黑 色 的 元 素 是 for 循环 中 涉及 交换 和 移动 到 右 侧 一 个 
位 置 的 元 素 。 对 于 每 一 个 i 值 ， 当 循环 结束 时 ， 元 素 al0] 到 afi-1] 是 按 顺 序 排列 的 。 当 i 为 
alength 时 ， 最 后 一 次 循环 完成 。 上 述 讨论 再 次 说 明了 在 研究 或 开发 新 算法 时 需要 做 的 第 一 
件 事 就 是 : 证 明 算 法 的 正确 性 。 这 样 做 提供 了 研究 算法 性 能 和 有 效 使 用 算法 的 基础 。 

运行 时 间 分 析 。 插 入 排序 的 数据 交换 部 分 代码 处 于 双重 嵌 套 的 for 循环 内 部 ， 这 表明 运 
行 时 间 是 二 次 型 的 ， 但 是 由 于 break 语句 的 存在 ， 不 能 立刻 得 出 这 个 结论 。 例 如 ， 在 最 理想 
的 情况 下 ， 也 就 是 输入 数组 已 经 是 按 序 排列 的 时 候 ; 内 层 for 循环 仅仅 需要 进行 一 次 比较 
(对 于 每 个 从 1 到 n-1 的 j， 判 断 afj-1] 是 否 小 于 或 等 于 a[j])， 车 是 则 结束 循环 )， 所 以 总 运 
行 时间 是 线性 的 。 如 果 输 入 数组 是 逆序 排序 ， 则 内 层 循环 会 全 部 执行 直到 结束 都 不 会 中 断 ， 
所 以 ， 内 层 循环 指令 的 执行 次 数 为 1t2+…+z-1 一 2， 即 运行 时 间 是 二 次 的 。 为 了 理解 插入 排 
序 对 于 随机 排序 数组 的 性 能 ， 仔 细 观 察 运行 跟踪 信息 : 这 是 一 个 nXn 数 组， 黑 色 元 素 对 应 
于 每 次 交换 。 也 就 是 说 ， 黑 色 元 素 的 个 数 是 内 层 循环 中 比较 和 交换 指令 执行 的 次 数 。 我 们 
预计 每 个 新 插入 元 素 可 能 被 插入 到 任何 位 置 ， 所 以 平均 来 说 ， 元 素 将 向 左 移动 一 半 距 离 。 因 
此 ， 我 们 预计 平均 情况 下 对 角 线 下 面 一 半 的 元 素 (总 共 约 2 ) 是 黑色 的 。 这 样 ， 可 以 直接 
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假设 : 针对 随机 排序 的 输入 数组 ， 插 入 排序 的 预期 运行 时 间 是 二 次 型 。 
处 于 对 角 线 上 方 的 大 约 r/2 个 元 素 是 灰色 的 


未 变 成 灰色 的 s had him and you his the but 
一 3 所 Was 1aC im angG YOU 15s TNe Du 
元 素 是 参与 比 ~、、hag was him and you his the but 
较 和 移动 的 had ‘him was and you his’ the but 
and has him was you his the but 

and had him was you his the but 

.ag ,A and had him his was you the but 
总 共有 72 个 元 素 and had him his the was you but 
and but had him his the was you 


处 于 对 角 线 下 方 的 数据 中 平 
均 有 一 半 是 黑色 的 ， 大 约 n34 个 


插入 排序 分 析 
排序 其 他 类 型 的 数据 。 我 们 希望 能 够 排序 所 有 类 型 的 数据 ， 而 不 仅仅 是 字符 串 。 在 科 
学 应 用 程序 中 ,我们 也 许 希 望 通过 数值 对 实验 结果 进行 排序 ; 在 商业 应 用 程序 中 ， 我 们 可 能 
希望 使 用 货币 金额 、 时 间或 日 期 ; 在 系统 软件 中 ， 我 们 可 能 希望 使 用 IP 地 址 或 进程 ID。 在 
以 上 这 些 应 用 场景 中 排序 的 想法 是 很 自然 的 ， 但 是 实现 一 种 适用 于 所 有 情况 的 排序 方法 就 需 
要 提供 抽象 机 制 ， 像 Java 接口 提供 的 功能 一 样 。 为 了 排序 数组 中 的 对 象 ， 我 们 只 需要 假设 
可 以 通过 某 种 机 制 比较 两 个 元 素 ， 以 查看 第 一 个 元 素 与 第 二 个 元 素 是 大 于 、 小 于 还 是 等 于 关 
系 。Java 为 此 提供 了 java.util.Comparable 接口 。 
public interface Comparable<Key> 


int compareTo(Key b) “将 这 个 对 象 与 对 象 b 进 行 比 较 ， 以 便 对 二 者 排序 
Java 中 java.uti1.Ccomparable 接口 的 API 


实现 Comparable 接口 的 类 为 其 对 象 实现 compareTo() 方法 ，a.compareTo(b) 的 功能 是 在 
a 小 于 b 时 返回 负 整 数 (通常 为 -1 )， 在 a 大 于 b 时 返回 正 整数 (通常 为 +1 )， 在 a 等 于 b 时 返 
回 0 (我 们 将 在 4.3 节 中 介绍 <Key> 符号 ， 它 用 来 确保 被 比较 的 两 个 对 象 具有 相同 的 类 型 )。 

小 于 、 大 于 、 等 于 的 确切 含义 取决 于 数据 类 型 ， 不 尊重 关于 这 些 概念 的 自然 数学 法 则 的 
实现 将 产生 无 法 预知 的 结果 。 更 正式 地 说 ，compareTo() 方法 必须 定义 一 个 总 顺序 。 这 意味 
着 以 下 三 个 属性 必须 成 立 (我 们 使 用 符号 xy 作为 x.compareTo(y)<=0 的 缩写 ， 以 及 x=y 作 
为 x.compareTo(y)==0 的 简写 ): 

。 反对 称 性 如 果 x 志 yy 并 且 yx， 则 x=y。 

。 传递 性 : 如 果 x<y 并 且 y 入 z， 则 xz。 

。 总 体 有 序 : x 和 7》 或 yz 至少 有 一 个 成 立 ， 或 者 两 者 都 成 立 。 

这 三 个 属性 适用 于 各 种 常见 的 排序 ， 包 括 字符 串 的 字母 顺序 和 整数 、 实 数 的 升序 。 我 们 将 
实现 Comparable 接口 的 数据 类 型 称 为 可 比较 的 数据 类 型 ， 并 将 相关 的 总 顺序 作为 其 自然 顺序 。 
Java 的 String 类 型 是 可 比较 的 ， 与 3.3 节 介绍 的 基本 封装 类 型 (如 Integer 和 Double) 类 似 。 

按照 这 个 约定 ，Insertion (程序 4.2.4 ) 实现 了 一 个 排序 方法 ， 将 一 个 可 比较 的 对 象 作为 
参数 ， 并 按照 compareTo() 指定 的 顺序 重新 排列 数组 ， 使 其 元 素 按照 升序 排列 。 现 在 ， 我 们 
可 以 使 用 Insertion.sort() 对 String[]、Integer[] 或 Double[] 类 型 的 数组 进行 排序 。 

使 数据 类 型 具有 可 比 性 也 很 容易 ， 以 便 我 们 可 以 对 用 户 定义 的 数据 类 型 进行 排序 。 为 了 实 
现 这 二 点， 必须 在 类 声明 中 添加 implements Comparable 语句 ， 然 后 添加 一 个 compareTo() 方法 
来 定义 总 顺序 。 例 如 ， 为 了 使 Counter 数据 类 型 具有 可 比 性 ， 我 们 如 下 修改 程序 3.3.2: 
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public class Counter implements Comparable<Counter> 
{ 


private int count; 


public int compareTo(Counter b) 

{ 
4 (count < b.count) return -1; 
else if (count > b.count) return +1; 
else return 0; 


} 
et 
现在 ,我 们 可 以 使 用 Insertion.sort() 按 升序 对 Counter 对 象 数组 进行 排序 。 546 









程序 4.2.4” 插 入 排序 


public class Insertion 
{ 
public static void sort(Comparable[] a) 
{ WN 将 a[] 中 的 元 素 按 升序 排列 > 
int n = a.length; a[] | 待 排 序数 组 
for (int i = 1; i < n; i++) 数组 长 度 
/ 将 a[ 记 插入 正确 的 位 置 
for (int j = i; j > 0; j--) 
if (a[j].compareTo(a[j-1]) < 0) 
exchange(a, j-1, j); 
else break; 



















} 


public static void exchange(Comparable[] a, int 1, int j) 
{ Comparable temp = a[j]; a[j] = a[i]; a[i] = temp; } 















public static void main(String[] args) 
{ /1/ 从 标准 输入 获得 一 系列 字符 串 , 对 它们 进行 排序 并 打印 出 来 
String[] a = StdIn.readA11Strings(); 
sort(a); 
for (int 1 = 0 1 < a.length; i++) 
StdOut.print(a[i] + " "); 
StdOut .print1nO; 





sort() 函 数 是 插入 排序 的 一 个 实现 。 它 对 实现 Comparable 接 口 的 任何 类 型 

的 数据 进行 排序 ( 因此 ， 有 一 个 compareTo0 方 法 ) 。Insertion.sort(0) 仅 适用 于 
中 其 对 于 乱 序 的 大 型 数组 来 说 ， 排 序 过 程 
慢 了 。 





% more 8words.txt 
was had him and you his the but 

% java Insertion < 8words.txt 

and but had him his the was you 

% java Insertion < TomSawyer.txt 

tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick 
tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick 
tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick tick 
547 


实证 分 析 。JInsertionDoublingTest (程序 4.2.5 ) 通过 在 n 个 随机 Double 对 象 上 运行 Insertion. 
sort()， 并 计算 其 运行 时 间 的 比率 来 测试 我 们 的 假设 : 对 于 随机 排序 的 数组 ,插入 排序 是 二 次 
型 的 。 这 个 比率 收敛 到 4， 验证 了 插 大 排序 运行 时 间 是 二 次 型 的 假设 ， 正 如 上 一 节 所 述 。 如 
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果 读 者 在 自己 的 计算 机 上 运行 InsertionDoublingTest， 将 会 理解 得 更 深刻 。 你 可 能 会 注意 到 对 于 
不 同 的 n 值 ， 系 统 的 缓存 或 其 他 机 制 会 对 性 能 有 不 同 的 影响 ,但 运行 时 间 是 二 次 型 的 这 个 结论 
应 该 十 分 明显 ， 所 以 你 很 快 就 会 相信 插入 排序 的 运行 速度 太 慢 ， 无 法 适用 于 大 型 输入 的 情况 。 

对 输入 的 敏感 性 。 请 注意 ，InsertionDoublingTest 有 一 个 命令 行 参数 trials， 并 针对 每 个 
问题 规模 进行 trials 次 实验 ， 而 不 是 一 次 。 正 如 我 们 所 观察 到 的 结果 ， 这 样 做 的 原因 之 一 是 
插入 排序 算法 的 运行 时 间 对 输入 值 敏感 。 这 与 诸如 ThreeSum 程序 的 行为 完全 不 同 ， 所 以 我 
们 需要 认真 解释 分 析 结 果 。 断 然 预 测 插 入 排序 算法 的 运行 时 间 是 二 次 型 的 不 合适 ， 因 为 应 用 
程序 可 能 包含 运行 时 间 为 线性 的 输入 情况 。 当 一 个 算法 的 性 能 对 输入 值 敏感 时 ， 如 果 不 考虑 
输入 因素 则 可 能 无 法 做 出 准确 的 预测 。 

存在 很 多 自然 的 应 用 场景 ， 对 它 使 用 插入 排序 时 算法 的 运行 时 间 可 能 是 二 次 型 的 ， 所 以 
我 们 需要 考虑 更 快速 的 排序 算法 。 正 如 本 书 4.1 节 所 述 ， 大 致 的 计算 结果 表明 使 用 一 台 速 度 
更 快 的 计算 机 并 没有 太 大 的 帮助 。 字 典 、 科 学 数据 库 或 商业 数据 库 可 能 包含 数 以 十 亿 计 的 元 

素 ， 如 何 才 能 排序 一 个 大 数组 ? 


程序 4.2.5 ”插入 排序 算法 的 倍增 测试 
public class InsertionDoublingTest 


public static double timeTrials(int trials, int n) 


{ 7 对 包 个 n 个 随机 元 素 的 数组 进行 排序 


double total = 0.0; trials | 实验 运行 次 数 
Double[] a = new Double[n]; i 问题 规模 
for (int t = 0; t < trials; t++) total | 消耗 的 总 时 间 
a : timer | 计时 器 
for (int i = 0; i < ni i++) oe 
a[i] = StdRandom.uniform(0.0，1.0); “3 | 待 排序 数组 加 
Stopwatch timer = new StopwatchO); prev 长 度 为 m12 的 数组 排序 的 时 间 
Insertion. sort(a); curr | 当前 实验 的 运行 时 间 l 
total += timer.elapsedTime(); ratio | 当前 实验 倍增 的 比率 | 


return total; 


public static void main(String[] args) 

{1 打印 插入 排序 在 输入 规模 倍增 时 的 时 间 增 长 系数 
int trials = Integer.parseInt(args[0]); 
for (int n = 1024; true; n += mn) 

{ 
double prev = timeTrials(trials, n/2); 
double curr = timeTrials(trials, n); 
double ratio = curr / prev; 
StdOut.printf("%7d %4.2f\n", n, ratio); 

} 

} 
} 





timeTrials() 方 法 针对 随机 排列 的 double 型 数组 运行 Insertion sort0 国 数 。 第 
一 个 参数 /是 数组 的 长 度 ， 第 二 个 参数 uials 是 运行 的 次 数 多 次 实验 会 产生 更 
精确 的 结果 ， 因 为 多 次 实验 可 以 减少 系统 影响 和 对 输 六 的 依赖 。 


% java InsertionDoublingTest 1 % java InsertionDoublingTest 10 
1024 0.71 1024 1.89 
2048 3.00 2048 5.00 
4096 5.20 4096 3.58 
8192 3.32 8192 4.09 
16384 3.91 16384 4.83 
32768 3.89 32768 3.96 
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归并 排序 “为 了 开发 一 个 更 快 的 排序 方法 ， 我 们 使 用 递 和 分 治 的 方法 来 设计 算法 ， 和 希望 
每 个 程序 员 都 能 理解 这 种 算法 。 分 治 法 是 指 解决 问题 和 
的 一 种 方法 或 思想 ， 即 把 问题 分 解 成 独立 的 部 分 ， 然 was had him and you his the but 
后 独立 地 解决 它们 ， 最 后 使 用 不 同 部 分 的 解决 方案 形 大 生生 仙人 全 全 
成 一 个 总 的 解决 方案 。 为 了 使 用 这 个 策略 对 一 个 数组 各 
进行 排序 ， 我 们 把 数组 分 成 两 部 分 ， 分 别 对 这 两 部 分 and had him was but his the you 
进行 排序 ， 然 后 合并 结果 从 而 对 整个 数组 进行 排序 。 和 ee 
这 个 算法 被 称 为 归并 排序 算法 。 归并 排序 概述 

处 理 一 个 给 定数 组 的 连续 子 数组 时 ， 我 们 使 用 
a[lo,hi) 表示 a[lo], a[lo+1], …, a[hi-1]( 采 用 与 二 分 查找 算法 中 使 用 的 相同 规则 表示 半 开 区 间 ， 
其 不 包含 afhi])。 为 了 排序 a[lo, hi])， 我 们 使 用 如 下 递归 策略 : 

。 基础 步骤 : 如 果子 数组 的 长 度 为 0 或 1， 则 排序 完成 。 

。 归纳 步骤 : 否则 ， 计 算 mid=lo+(hi-lo)/2， 递 归 地 对 两 个 子 数组 aflo, mid) 和 a[mid， 








hi) 排序 并 合并 它们 。 
TP al] 
| 1 Pa 二 
and had him Was but his the you 
0 0 and and had him was but his the you 
各 de but and had him was but his the you 
1. 2 had and had him was but his the you 
2 3 him and had him was but his the you 
3 4 his and had him was but his the you 
3 ru: ES the and had him was but his the you 
3 7 6 was and had him was but his the you 
4 you and had him Was but his the you 





将 已 排序 的 左 子 数 组 与 已 排序 的 右 子 数组 合并 的 跟踪 信息 


Merge (程序 4.2.6 ) 是 这 个 算法 的 一 种 实现 。 数 组 元 素 通过 递归 调用 代码 重新 排列 ， 然 
后 合并 递归 调用 后 数组 的 两 个 部 分 。 通 常 ， 理 解 归 并 过 程 最 简单 的 方法 是 分 析 一 次 排序 过 程 
的 跟踪 信息 。 代 码 中 索引 i 用 于 第 一 个 子 数 组 ， 索 引 j 用 于 第 二 个 子 数组 ， 第 三 个 索引 k 用 
于 存储 结果 的 辅助 数组 aux[]。 归 并 的 实现 是 一 个 单 循环 ， 将 aux[k] 设置 为 a[i 或 afj] ( 然 
后 递增 k， 以 及 i 和 j 中 被 采用 的 那个 值 )。 如 果 i 或 j 中 的 任何 一 个 已 经 到 达 子 数组 的 末端 ， 
pedi etre 

。 当 两 个 子 数组 中 的 所 有 元 素 都 复制 到 aux[] 后 ， 将 aux[] 中 的 排序 结果 复制 给 原始 数组 。 
请 卖 者 务必 花 点 时 间 来 研究 给 出 的 跟踪 信息 ， 以 更 好 地 理解 代码 为 什么 总 是 可 以 正确 合并 两 
个 排 好 序 的 子 数组 ， 从 而 排序 整个 数组 的 原理 。 

递归 方法 可 以 保证 两 个 子 数组 在 合并 前 正确 排序 。 同 样 ， 理 解 这 个 过 程 的 最 好 方法 是 研 
究 每 次 递归 调用 sort() 方法 后 返回 的 数组 内 容 的 跟踪 信息 。 下 面 显 示 了 我 们 这 个 例子 的 跟踪 
信息 。 首 先 合并 a[0] 和 a[1] 为 一 个 排序 子 数组 a[0, 2)， 然 后 合并 a[2] 和 a[3] 为 排序 子 数组 
a[2, 4)， 然 后 将 这 两 个 大 小 为 2 的 子 数组 合并 为 一 个 排序 子 数组 [0, 4)， 以 此 类 推 。 如 果 你 已 经 
确信 了 合并 处 理 的 正确 性 ， 则 只 需要 理解 车 代码 可 以 正确 地 分 割 数组 ， 那 么 它 就 能 够 准确 地 
排序 。 请 注意 ， 当 要 排序 的 数组 中 元 素数 量 不 是 偶数 时 ， 左 半 部 分 会 比 右 半 部 分 少 一 个 元 素 。 
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sort(a, aux, 0, 8) 
sort(a, aux, 0, 4) 
sort(a, aux, 0, 2) 
return had was him and you his the 
sort(a, aux, 2, 4) 
return had was and him you his the 
return and had him was you his the 
sort(a, aux, 4, 8) 
sort(a, aux, 4, 6) 


return and had him was his you: the 
sort(a, aux, 6, 8) 4 
return and had him was his you but 
return and had him was but his the 
return and but had him his the was 
使 用 递归 调用 进行 归并 排序 的 跟踪 

















程序 4.2.6” 归 并 排序 


public class Merge 
{ 


public static void sort(Comparable[] a) 

b 
Comparable[] aux = new Comparable[a.length]; 
sort(a, aux, 0, a.length); 


} 


private static void sort(Comparable[] a, Comparable[] aux, 
int lo, int hi) 
{ /W 对 a[lo, hi) 排 序 












else if (j == hi) aux[k] = a[i++]; 
else if (a[j].compareTo(a[i]) < 0) aux[k] = a[j++]; 
else aux[k] = a[i++]; 
for (int k = 1o; k < hi; k++) 
; a[k] = aux[k]; 
于 
public static void main(String[] args) 
关山 程 序 42 三好 } 





+ 


sort0) 函 数 是 归并 排序 的 一 个 实现 。 它 对 实现 Comparable 接 日 的 任何 数据 
类 型 的 数组 进行 排序 。 与 Insertion.sort0 相 比 ， 这 个 实现 适用 于 排序 数据 量 很 大 
的 数组 。 














% java Merge < 8words.txt 
was had him and you his the but 


% java Merge < TomSawyer .txt 
. achievement aching aching acquire acquired ... 


if (hi - lo <= 1) return; ia[lo，hi) | 待 排 序 的 子 数组 
int mid = 1o + (hi-10)/2; 1o 最 小 索引 
sort(a，aux，1o，mid); ”mid 中 间 索 引 
sort(a, aux, mid, hi); [> J 最 大 索引 
int i = 10, j = mid; | aux[] “| 辅助 数组 
for (Cint k = lo; k < hi; k++) 

4 (i == mid) aux[k] = a[j++]; 


务 4 芋 
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运行 时 间 分 析 。 归 并 排序 的 内 层 循 环 以 辅助 数组 为 中 心 。 两 个 for 循环 都 包含 n 次 迭 
代 ， 因 此 内 层 循环 中 指令 的 执行 频率 与 递归 函数 调用 的 子 数组 长 度 之 和 成 正比 。 当 我 们 按照 
子 数组 的 大 小 对 调用 过 程 进行 分 层 时 ， 就 很 容易 观察 指令 执行 的 总 量 。 为 了 方便 起 见 ， 我 们 
假设 是 2 的 军 ， 即 到 24. 在 第 一 层 ， 包 括 一 个 大 小 为 n 的 调用 ; 在 第 三 层 ， 包 括 两 个 大 小 
为 n/2 的 调用 ; 在 第 三 层 ， 包 括 四 个 大 小 为 w4 的 调用 。 以 此 类 推 ， 直到 n/2 调用 大 小 为 2 
时 ， 就 是 最 后 一 层 调用 。 完 成 所 有 的 计算 正好 有 

把 lgn 层 调用 ， 因 此 归并 排序 算法 的 循环 中 指令 


0 PN ene es er 
执行 的 总 次 数 为 mlgn。 这 个 公式 也 证 明了 归并 排 ， 


IE 
序 算 法 的 运行 时 间 是 线性 对 数 的 假设 。 请 注意 : 8xn/8=n i BE) he) ss MR) i IE 2 一 共 lgn 层 


当 闫 不 是 2 的 竹 时 ， 每 一 层 的 子 数 组 的 大 小 不 一 : ; 
定 是 相同 的 ,但 层 的 数目 仍然 是 对 数 型 的 ， 所 以 ww2x2=n Do wt DOD0 


线性 对 数 假设 对 所 有 的 ”都 是 成 立 的 《参见 练习 “归并 排序 内 层 循环 执行 次 数 计数 ( 当 上 是 2 的 时 时 ) 


4.2.18 和 4.2.19 )。 

建议 你 在 自己 的 计算 机 上 运行 像 程 序 4.2.5 中 的 Merge.sort() 来 测试 前 面 的 代码 。 尝 试 
运行 后 ， 你 将 会 发 现 Merge.sort() 比 Insertion.sort() 要 快 得 多 ， 因 而 可 以 相对 容易 地 排序 超 
大 型 的 数组 。 验 证 运行 时 间 是 线性 对 数 型 的 假设 需要 更 多 的 工作 ,但 你 可 以 看 到 归并 排序 可 
以 解决 那些 使 用 暴力 破解 算法 (如 插入 排序 ) 无 法 解决 的 问题 。 

三 次 型 与 线性 对 数 型 之 间 的 渔 沟 。 妈 和 mogz 之 间 的 差异 导致 这 两 个 算法 在 实际 应 用 中 
有 很 大 的 不 同 ， 就 像 通过 三 分 查找 算法 克服 线性 - 对 数 之 间 的 鸿沟 一 样 。 了 解 这 种 巨大 的 差 
异 是 理解 算法 设计 和 分 析 重 要 性 的 另 一 个 关键 步 又。 对 于 许多 重要 的 计算 问题 ， 从 二 次 型 到 
线性 对 数 型 的 速度 提升 (比如 通过 归并 排序 实现 排序 ) 会 使 得 程序 能 够 解决 涉及 大 量 数 据 的 
问题 ， 而 这 些 问题 使 用 二 次 型 的 算法 可 能 根本 无 法 有 效 解 决 。 

分 治 算法 。 我 们 使 用 的 分 治 方 法 对 于 许多 重要 问题 都 是 有 效 的 ， 如 果 你 学 习 了 算法 设计 
课程 的 话 ， 将 会 了 解 到 这 一 点 。 目 前 ,我 们 鼓励 你 研究 本 节 结 尾 的 部 分 练习 题 ， 这 些 练习 描 
述 了 分 治 算法 能 够 解决 的 一 系列 问题 ， 而 没有 分 治 算法 ， 这 些 问 题 根 本 就 不 可 能 解决 。 

归 约 为 排序 问题 。 如 果 我 们 可 以 用 问题 B 的 解决 方案 来 解决 问题 A， 则 称 问题 A 可 归 
约 为 问题 B。 从 零 开 始 设计 一 个 新 的 分 治 算法 有 时 类 似 于 解决 一 个 需要 一 定 经 验 和 独创 性 的 
难题 ， 所 以 你 可 能 没有 信心 解决 这 个 问题 。 然 而 一 个 简单 的 方法 通常 是 有 效 的 : 给 定 一 个 新 
的 问题 ， 问 问 自己 如 果 数 据 进 行 排序 后 将 如 何 解决 。 通 常情 况 下 ， 针 对 一 个 排 好 序 的 数组 ， 
一 个 相对 简单 的 线性 扫描 就 可 以 完成 任务 。 对 于 这 类 情况 ， 利 用 类 似 归 并 排序 算法 中 的 智 
慧 ， 我 们 就 得 到 了 线性 对 数 型 算法 。 例 如 ， 和 确定 一 个 数组 中 的 每 父 元 素 是 否 都 是 不 同 的 ， 也 
被 称 为 元 素 不 同性 问题 ， 就 可 以 归 约 为 排序 ， 因 为 我 们 可 以 对 数组 进行 排序 ， 然 后 通过 扫 
描 排 好 序 的 数组 来 检查 一 个 元 素 的 值 是 否 等 于 下 一 个 ， 如 果 都 不 相等 ,那么 值 是 不 同 的 。 再 
如 ， 实 现 StdStats.median() (参见 2.2 节 ) 的 简单 方法 是 将 选择 归 约 为 排序 。 接 下 来 我 们 分 析 
一 个 更 复杂 的 例子 ， 你 也 可 以 在 本 节 最 后 的 练习 中 找到 许多 其 他 例子 。 

归并 排序 算法 归功 于 物理 学 家 约翰 汉 :… 诺 依 曼 (John von Neumann)， 他 是 最 早 认识 
到 计算 在 科学 研究 中 重要 性 的 科学 家 之 一 。 冯 : 诺 依 曼 为 计算 机 做 出 了 许多 贡献 ,包括 自 
20 世纪 50 年 代 使 用 至 今 的 计算 机 体系 结构 的 基本 概念 。 关 于 应 用 程序 编程 ， 汉 。 诺 依 曼 提 
出 了 如 下 观点 : 

。 排序 是 许多 应 用 程序 的 基本 组 成 部 分 。 
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。 二 次 型 算法 对 于 许多 实际 问题 来 说 太 慢 了 。 

。 分 治 算法 是 有 效 的 。 

。 证 明 程 序 的 正确 性 并 知道 其 开销 非常 重要 。 

虽然 计算 机 的 速度 比 以 前 要 快 很 多 个 数量 级 ,而且 比 汉 : 庄 依 曼 可 用 的 计算 机 有 更 多 的 
内 存量 ,但 是 这 些 基 本 概念 在 今天 依然 很 重要 。 有 效 且 成 功 使 用 计算 机 的 人 都 明白 ,在 通常 
情况 下 暴力 算法 是 不 足以 解决 问题 的 ， 这 个 局 面 和 汉 … 诺 依 曼 的 时 代 一 样 。 

应 用 程序 : 频率 计数 FrequencyCount (程序 4.2.7 ) 从 标准 输入 中 读 取 字符 串 序列 ， 向 
标准 输出 写 人 查找 到 的 不 同 字 符 串 以 及 出 现 的 次 数 ， 并 按照 频率 降序 排列 。 这 种 计算 适用 于 
许多 应 用 : 一 个 语言 学 家 可 能 正在 研究 文本 中 单词 的 使 用 模式 ， 一 个 科学 家 可 能 正在 实验 数 
据 中 寻找 经 常 发 生 的 事件 ， 一 个 商人 可 能 正在 寻找 最 常 出 现在 交易 列表 中 的 客户 ， 一 个 网 络 
分 析 师 可 能 正在 寻找 最 活跃 的 用 户 。 每 个 应 用 程序 都 可 能 包含 数 百 万 或 者 更 多 个 字符 串 ， 所 
以 我 们 需要 一 个 线性 对 数 算法 (或 更 好 的 算法 )。FrequencyCount 是 通过 将 问题 归 约 为 排序 
来 找到 解决 问题 的 算法 。 实 际 上 ， 这 个 程序 进行 了 两 次 排序 操作 。 

计算 频率 。 第 一 步 是 从 标准 输入 读 取 字符 串 并 将 其 排序 。 在 这 种 情况 下 ， 我 们 感 兴趣 的 
不 是 字符 串 是 否 按照 字母 序 排列 ， 而 是 排序 操作 使 得 相同 的 字符 排列 在 一 起 。 如 果 输 入 是 


to be or not to be to 


那么 排序 的 结果 是 

be be not or to to to 本 a[i] 下 

0 

相同 的 字符 串 (例如 在 数组 中 be 出 现 了 两 次 to 出 现 7 ，。 ,。， 
三 次 ) 在 数组 中 排列 在 一 起 。 所 以 扫描 数组 一 遍 就 可 以 1 1 陀 疲 涉 
完成 频率 的 计算 。 我 们 在 3.3 节 中 提 到 的 Counter 数据 类 2 2? not 1 
型 是 完成 这 项 工作 的 完美 工具 。 回 想 一 下 ，Counter( 程 l : 人 + 1 
序 3.3.2 ) 包含 一 个 字符 串 实例 变量 (初始 化 为 构造 函数 参 5 4 to 2 
数 )、 一 个 计数 实例 变量 (初始 化 为 0) 和 一 个 使 计数 器 递 6 4 to N13 
增 1 的 inerement() 实例 方法 。 我 们 维护 一 个 整数 m 和 一 个 二 


Counter 对 象 数组 zipff]， 并 针对 每 个 字符 串 执行 以 下 操作 : 9 
。 如 果 字 符 串 不 等 于 前 一 个 字符 串 ， 则 创建 一 个 新 的 Counter 对 象 并 将 m 加 1。 
。 把 最 近 创建 的 Counter 对 象 加 1。 
最 后 ，m 的 值 是 不 同 字符 串 的 数量 ，zipffi] 包含 第 i 个 字符 串 及 其 频率 。 
排序 频率 。 接 下 来 ,我 们 按照 频率 对 Counter 对 象 进行 排序 。 
可 以 在 客户 程序 代码 中 这 样 做 的 前 提 是 Counter 实现 了 Comparable 
接口 ， 其 compareTo() 方 法 通过 count 来 比较 对 象 ( 请 参阅 练 0 2 
习 4.2.14)。 一 旦 完成 ， 我 们 只 需 对 数组 进行 排序 即 可 ! 请 注意 ， 2 
FrequencyCount 中 按照 最 大 可 能 长 度 申请 了 zipf] 数组 ， 而 我 们 只 利 关 页 
需 对 其 子 数组 进行 排序 。 其 实 我 们 可 以 在 分 配 zipf[] 之 前 对 words[] 之 后 


zipf[1i] 


进行 一 次 扫描 ， 以 确定 不 同 字 符 串 的 数量 。 我 们 把 修改 和 优化 9 (oe 
Merge (程序 4.2.6 ) 的 工作 留 作 练 习 (参见 练习 4.2.15 )。 . 5 ft 
齐 普 夫 定律 (Zipf's law)。 程 序 FrequencyCount 最 常见 的 应 用 3 3 to 


是 基本 语言 分 析 : 哪些 词 在 文本 中 出 现 频 率 最 高 ? 通过 现象 观测 表 频率 排序 
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明 ， 在 一 篇 包含 m 个 不 同 单词 的 文章 中 ， 第 i 个 最 频繁 出 现 单词 的 频率 正比 于 1/i， 其 比例 
常数 是 谐 波 数 五, 的 倒数 ， 这 被 称 为 齐 普 夫 定 律 。 例 如 ; 第 三 个 最 常 出 现 的 单词 的 出 现 频 率 
是 第 一 个 的 一 半 左 右 。 令 人 惊讶 的 是 ， 这 个 经 验 假设 可 以 适用 于 各 种 场景 ， 从 财务 数据 到 网 络 
使 用 统计 数据 。 程 序 4.2.7 中 的 测试 客户 程序 使 用 了 一 个 包含 从 网 络 中 随机 抽取 的 100 万 个 语 
句 的 数据 库 , ;用 以 验证 齐 普 夫 定 律 〈 请 参见 本 书 官网 )。 

你 很 可 能 会 发 现 ， 在 编写 程序 来 完成 一 个 简单 任务 时 ， 先 对 数据 进行 排序 可 以 帮助 你 很 
容易 地 解决 这 个 问题 。 有 多 少 不 同 的 值 ? 哪个 值 最 常 出 现 ? 中 间 值 是 什么 ? 使 用 归并 排序 等 
线性 对 数 型 排序 算法 ， 甚 至 可 以 解决 巨型 数据 集 的 问题 。FrequencyCount 就 是 一 个 很 好 的 例 
子 ， 它 使 用 了 两 次 不 同类 型 数据 的 排序 操作 。 如 果 暴 力 排序 不 适用 ， 则 可 能 会 应 用 其 他 一 些 
分 治 算法 ， 或 者 可 能 需要 一 些 更 复杂 的 方法 。 如 果 没 有 一 个 好 的 算法 〈 以 及 对 其 性 能 特征 的 
理解 )， 你 可 能 会 觉得 很 姐 丧 : 为 什么 自己 快速 和 昂贵 的 计算 机 却 无 法 解决 看 起 来 很 简单 的 
问题 ? 随 着 问题 规模 的 增 大 ， 如 果 你 知道 如 何 有 效 地 解决 这 个 问题 ， 你 会 发 现 计 算 机 可 以 成 
为 一 台 超 乎 想象 的 计算 工具 。 


程序 4.2:7 频率 计数 





public class FrequencyCount 


public static void main(String[] args) 
{ 人 按照 出 现 频率 的 降序 排列 输 兴 的 字符 融 s， | 输入 信息 
words[] | 输入 中 的 字符 此 
String[] words = StdIn.readA11Strings() ; zipf[] | 计数 器 数组 
Merge.sort(words); 伐 < 同 A 
Counter[] zipf = new Counter[words.length]; 不 同 字符 串 的 个 数 
int m = 0; 
for (int i = 0; i < words.length; i++) 
{ ”WU 创建 新 的 计数 器 ， 或 者 将 上 一 个 计数 器 加 1 
if (i == 0 || !words[i] .equals(words[i-1])) 
zipf[m++] = new Counter(words[i], words.length); 
zipf[m-1].increment(); 


} 
Merge.sort(zipf, 0, m); 
for (int j = m-1; j >= 0; j--) 
StdOut. ee 
} 
} 


该 程序 对 标准 输入 中 的 单词 进行 排序 ， 使 用 排 好 序 的 数组 计算 每 个 单词 的 
出 现 频率 ， 然 后 对 频率 进行 排序 。 下 面 使 用 的 测试 文件 超过 2000 万 字 。 在 绘制 
的 图 中 ， 柱 状 图 用 于 表示 第 ;个 词 与 第 一 个 词 频率 的 比值 ， 曲 线 表示 ] 大 ， 你 可 以 
看 到 它们 的 相对 关系 。 


% java FrequencyCount < LeipziglM.txt 
the: 1160105 
of: 593492 
to: 560945 
a: 472819 
and: 435866 
in: 430484 
for: 205531 
The: 192296 
that: 188971 
is: 172225 
said: 148915 
on: 147024 
was: 141178 
by: 118429 
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经 验 总 结 我 们 可 以 通过 编写 程序 来 解决 很 多 复杂 的 实际 问题 ， 而 我 们 编写 的 绝 大 多 
数 程序 均 需 要 开发 清晰 正确 的 解决 方案 ,将 程序 分 解 成 可 控 大 小 的 模块 ， 完 成 开发 并 测试 和 
调试 它们 ， 最 终 给 出 解决 方案 。 从 一 开始 ， 我 们 就 在 本 书 中 遵循 这 个 原则 和 方法 以 进行 程序 
设计 。 但 是 当 你 致力 于 开发 更 复杂 的 应 用 程序 时 ， 你 会 发 现 清 晰 正确 的 解决 方案 并 不 一 定 能 
解决 所 有 的 问题 ， 因 为 计算 成 本 可 能 是 一 个 限制 因素 。 本 节 中 的 例子 就 是 对 这 个 事实 的 基本 
阐述 。 

重视 计算 成 本 。 如 果 你 能 用 一 个 简单 的 算法 很 快 解决 一 个 小 规模 问题 ， 那 是 最 好 的 。 但 
是 ， 如 果 你 需要 解决 涉及 大 量 数据 或 大 量 计算 的 问题 ， 则 必须 要 考虑 成 本 。 

归 约 为 一 个 已 知 问题 。 我 们 使 用 频率 计数 排序 说 明了 理解 基本 算法 并 将 其 用 于 解决 问题 
的 效用 。 

分 治 算法 。 你 应 该 思考 一 下 分 治 的 力量 ， 正 如 开发 线性 对 数 型 排序 算法 〈 归 并 排序 ) 所 
表明 的 那样 ， 该 算法 是 解决 很 多 计算 问题 的 基础 。 分 治 只 是 开发 高 效 算法 的 一 种 方法 。 

自从 计算 出 现 以 来 ， 人 们 就 一 直 致 力 于 开发 可 以 高 效 解决 问题 的 算法 ， 如 二 分 查找 法 和 
归并 排序 算法 等 。 这 个 研究 领域 被 称 为 “算法 设计 与 分 析 ”， 其 研究 包括 设计 规范 (如 分 治 
和 动态 规划 等 )、 关 于 算法 性 能 预 估 的 技术 、 用 于 解决 各 种 实际 问题 的 算法 (如 排序 和 查找 
等 ) 等 。 你 可 以 在 Java 库 或 其 他 专业 库 中 找到 许多 这 些 算法 的 实现 ， 它 们 是 我 们 计算 的 基 
本 工具 ， 但 是 理解 这 些 工具 就 像 理 解数 学 或 科学 的 基本 工具 一 样 。 你 可 以 使 用 矩阵 处 理 包 来 
求解 矩阵 的 特征 值 ， 但 是 仍然 需要 学 习 线性 代数 课程 。 现 在 你 已 经 知道 一 个 快速 算法 可 以 产 
生 徒 劳 无 获 和 正确 解决 一 个 实际 问题 的 差异 ， 下 面 可 以 开始 寻找 在 哪些 情况 下 算法 设计 和 分 
析 的 知识 可 以 有 所 作为 ， 以 及 在 哪里 使 用 高 效 的 算法 (如 二 分 查找 和 归并 排序 ) 可 以 有 效 地 
解决 问题 。 


问答 环节 


问 : 为 什么 我 们 需要 花费 如 此 巨大 的 精力 来 证 明 程序 的 正确 性 ? 

答 : 为 了 避免 更 大 的 痛苦 。 二 分 查找 法 就 是 一 个 著名 的 例子 。 你 现在 已 经 理解 了 二 分 查 
找 法 。 一 个 经 典 的 实现 方法 是 使 用 while 循环 而 不 是 递归 。 试 着 解决 练习 4.2.2， 但 不 要 参考 
书 中 的 代码 。Jon Bentley 曾经 做 过 一 个 著名 的 实验 ， 要 求 几 个 专业 程序 员 编 写 该 程序 ， 结 果 
他 们 的 解决 方案 大 多 数 都 是 不 正确 的 。 

问 : Java 库 中 是 否 实现 了 排序 和 查找 ? 

答 : 是 的 。Java 包 java.util 中 包含 了 实现 归并 排序 和 二 分 查找 的 静态 方法 Arrays.sort() 
和 Arrays.binarySearch()。 实 际 上 ， 每 个 方法 代表 着 一 系列 同名 的 重 载 方法 ， 分别 用 于 
Comparable 类 型 和 所 有 基本 类 型 (每 个 类 型 一 个 )。 

问 : 那么 本 书 为 什么 不 使 用 它们 呢 ? 

答 : 其 实 可 以 随意 使 用 它们 。 -但 正如 我 们 研究 过 的 很 多 主题 一 样 ， 如 果 你 了 解 其 背后 的 
原理 知识 ， 就 可 以 更 有 效 地 使 用 这 些 工 具 。 

问 : 请 解释 为 什么 我 们 使 用 lo+(hi-lo)/2 来 计算 lo 和 hi 的 中 点 ， 而 不 是 使 用 (lo+hi)/2。 

答 : 后 者 在 计算 lothi 时 可 能 会 有 int 型 溢出 的 错误 。 

问 : 编译 Insertion.java 和 Merge.java 时 ， 为 什么 会 出 现 “unchecked or unsafe operation” 
(未 经 检查 或 不 安全 的 操作 ) 警告 ? 
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答 : sort() 的 参数 是 一 个 Comparable 类 型 的 数组 ， 但 是 在 技术 上 并 没有 禁止 使 用 不 同类 
型 元 素 的 数组 。 要 消除 警告 ， 请 将 签名 更 改 为 : 


public static<Key extends Comparable<Key>>void sort(Key[] a) 
我 们 将 在 下 一 节 讨 论 泛 型 (generic) 时 学 习 <Key> 符号 。 


练习 


4.2.1 为 Questions (程序 4.2.1 ) 开发 一 个 新 版 本 的 实现 ， 从 命令 行 接收 参数 n 作为 最 大 数字 。 证 明 你 
的 实现 是 正确 的 。 

4.2.2 实现 BinarySearch (程序 4.2.3 ) 的 非 递归 版 本 。 

4.2.3 ”修改 BinarySearch (程序 4.2.3 )， 实 现 如 下 功能 : 如 果 搜 索 的 关键 字 在 数组 中 存在 ， 则 返回 满足 
a[i] 等 于 key 的 最 小 索引 i， 否则 返回 -i， 其 中 i 是 a[i] 比 key 大 的 最 小 索引 。 

4.2.4 ”如果 将 二 分 查找 法 应 用 于 无 序数 组 ， 描 述 会 发 生 什 么 情况 。 为 什么 不 在 每 次 调用 二 分 查找 法 之 
前 检查 数组 是 否 有 序 ? 请问 你 是 否 可 以 判断 三 分 查找 算法 检查 的 元 素 是 不 是 升序 排列 的 ? 

4.2.5 ”描述 为 什么 二 分 查找 算法 需要 使 用 不 可 变 的 关键 字 。 

4.2.6 ”向 Insertion 中 添加 代码 ， 以 生成 正文 中 给 出 的 跟踪 信息 。 

4.2.7 向 Merge 中 添加 代码 以 生成 如 下 所 示 的 跟踪 信息 : 


% java Merge < tiny.txt 
was had him and you his the but 
had was 
and him 
and had him was 
his you 
but the 
but his the you 
and but had him his the was you 


4.2.8 ”以 正文 中 的 样式 ， 给 出 插入 排序 和 归并 排序 的 跟踪 信息 , “假设 输入 如 下 : it was the best of times 
it was。 
4.2.9 实现 程序 4.2.2 更 通用 化 的 版 本 ,将 二 分 查找 算法 应 用 于 任何 单调 递增 的 函数 。 使 用 与 3.3 节 中 
数值 积分 示例 相同 的 函数 式 编程 。 
4.2.10 ”编写 一 个 过 滤器 程序 DeDup， 它 从 标准 输入 中 读 取 字符 串 ， 在 标准 输出 中 输出 去 掉 所 有 重复 
字符 串 后 的 字符 串 序列 (并 保持 排序 状态 )。 
4.2.11 修改 StockAccount (程序 3.2.8 )， 使 其 实现 Comparable 接口 .( 按 名 称 比较 股票 账户 )。 提 示 : 
使 用 String 数据 类 型 中 的 compareTo() 方法 完成 这 项 繁重 的 工作 。 
4.2.12 ”修改 Vector (程序 3.3.3 )， 为 其 实现 Comparable 接口 ， 然 后 使 用 字典 顺序 按 坐 标 比较 向 量 。 
4.2.13 ”修改 Time (练习 3.3.21 )， 为 其 实现 Comparable 接口 ， 然 后 按时 间 先 后 顺序 比较 时 间 值 。 
4.2.14 ”修改 Counter (程序 3.3.2 )， 为 其 实现 Comparable 接口 ， 然 后 通过 频率 计数 比较 对 象 。 
4.2.15 在 Insertion (程序 4.2.4 ) 和 Merge (程序 4.2.6 ) 中 添加 方法 以 支持 排序 子 数组 。 
4.2.16 ”开发 非 递归 版 本 的 归并 排序 算法 (程序 4.2.6)。 为 了 简单 起 见 ， 假 设 项 的 数目 nn 是 2 的 需 。 加 
分 题 : 即使 n 不 是 2 的 需 ， 也 要 使 你 的 程序 正常 工作 。 
4.2.17 请 统计 你 最 喜欢 的 小 说 中 单词 的 频率 分 布 。 请 问 结果 遵守 齐 普 夫 定律 吗 ? 
4.2.18” 从 数学 上 分 析 使 用 归并 排序 处 理 长 度 为 n 的 数组 时 比较 操作 发 生 的 次 数 。 为 了 简单 起 见 ， 假 
设 n 是 2 的 知 。 
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4.2.19 


答案 : 设 M(n) 为 归并 排序 长 度 为 n 的 数组 的 比较 次 数 。 合 并 两 个 总 长 度 为 n 的 子 数组 需 
要 了 n 到 -1 次 比较 。 因 此 ，MKn) 满足 以 下 递 推 关系 ， 
M(n)<2M(n/2)+n 
当 nn=1 时，M(1)=0。 用 2* 代 蔡 n 给 出 
M(2")<2M(2"!)+2* 
这 与 我 们 给 出 的 二 分 查找 法 的 递 推 公式 相似 ， 但 更 复杂 。 如 果 我 们 将 公式 两 边 同 时 除 以 24， 
就 可 以 得 到 
M(29/24 生 MO-D/2eI+1 
这 正好 与 二 分 查找 法 一 致 。 也 就 是 说 ，M(2”)/2*<7(2)=n。 用 nn 代替 2 (并 且 lgn 代替 k)， 结 
果 得 到 M(n) 三 nlgn。 通 过 类 似 的 证 明 可 以 得 到 Mn) >3nlgn, 
分 析 不 是 2 的 寡 时 的 归并 排序 情况 。 
部 分 解答 : 当 丰 是 一 个 奇数 时 ， 一 个 子 数组 比 另 一 个 多 一 个 元 素 ， 所 以 当 # 不 是 2 的 客 
时 ， 每 一 层 的 子 数 组 不 一 定 都 是 相同 的 大 小 。 同 样 ， 每 个 元 素 必 定 会 出 现在 某 一 个 子 数 组 中 ， 
并 且 层 的 数量 仍然 是 对 数 型 ， 所 以 线性 对 数 的 假设 对 于 所 有 的 n 都 是 合理 的 。 


创新 练习 


以 下 练习 旨 在 增加 读者 快速 解决 典型 问题 的 经 验 。 考 虑 使 用 二 分 查找 法 和 归并 排序 算法 ， 或 者 设 
计 自 己 的 分 治 算法 。 实 现 并 测试 你 的 算法 。 


4.2.20 


4:2.21 


4.2.22 


4.2.23 


4.2.24 


4.2.25 


4.2.26 


4.2.27 


4.2.28 


4.2.29 


中 位 数 。 向 StdStats (程序 2.2.4 ) 添加 一 个 方法 median()， 该 方法 以 线性 时 间 计 算 n 个 整数 数 
组 的 中 值 。 提 示 : 归 约 为 排序 。 

众 数 。 在 StdStats (程序 2.2.4 ) 中 添加 方法 mode()， 该 方法 以 线性 时 间 计 算 n 个 整数 数组 的 众 
数 ( 最 频繁 出 现 的 值 )。 提 示 : 归 约 为 排序 。 

整数 排序 。 编 写 一 个 线性 运行 时 间 的 过 滤器 ， 从 标准 输入 读 取 一 个 位 于 0 到 99 之 间 的 整数 序 
列 ， 并 在 标准 输出 中 输出 排序 后 的 整数 。 例 如 ， 如 果 输 入 序列 为 


9823100039892220002 
你 的 程序 应 该 打印 输出 序列 
0000001222223398 9898 


向 下 和 向 上 使 入 。 给 定 一 个 包含 n 个 可 比较 项 的 有 序数 组 ， 请 编写 函数 floor() 和 ceiling()， 以 
对 数 时 间 返 回 不 大 于 (或 小 于 ) 参数 项 的 最 大 (或 最 小 ) 项 的 索引 。 

双 调 最 大 值 。 如 果 一 个 数组 由 递增 关键 字 序列 紧 跟 一 个 递减 关键 字 序列 组 成 ， 那 么 称 之 为 双 
调 数组 。 给 定 一 个 双 调 数组 ， 设 计 一 个 对 数 运 行 时 间 算 法 ， 以 查找 最 大 关键 字 的 索引 。 

双 调 数组 中 的 查找 。 给 定 一 个 包含 对 个 不 同 整数 的 双 调 数组 ， 设 计 一 个 对 数 时 间 算 法 ， 用 于 
确定 一 个 给 定 的 整数 是 否 在 数组 中 。 

最 接近 数 对 。 给 定 一 个 n 个 实数 的 数组 ， 设 计 一 个 线性 时 间 算法 ， 以 找 出 一 对 值 最 接近 的 数 。 
最 远离 数 对 。 给 定 一 个 n 个 实数 的 数组 ,设计 一 个 线性 时 间 算 法 ， 以 找到 一 对 值 差 别 最 大 的 数 。 
两 数 和 。 给 定 一 个 包含 nn 个 整数 的 数组 ， 设 计 一 个 线性 时 间 算 法 ， 以 确定 它们 中 是 否 存 在 任 
何 两 个 数 的 和 为 0。 

三 数 和 。 给 定 一 个 包含 nn 个 整数 的 数组 ,设计 一 个 算法 ， 以 确定 它们 中 是 否 有 三 个 数 的 和 为 
0。 你 的 程序 的 运行 时 间 应 该 正比 于 rrlogn。 加 分 题 : 编写 一 个 以 二 次 型 时 间 解 决 问题 的 程序 。 


4.2.33 


4.2.34 


4.2.35 


4.2.36 


2537 


4.2.38 


4.2.39 


4.2.40 
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多 数 派 。 在 一 个 长 度 为 n 的 数组 中 ， 如 果 一 个 元 素 出 现 的 次 数 超过 n/2 次 ， 则 称 为 多 数 派 。 给 
定 一 个 字符 串 数组 ， 设 计 一 个 线性 时 间 算 法 来 识别 多 数 派 (如 果 存 在 的 话 )。 

最 大 的 空白 间隔 。 给 定 Web 服务 器 上 某 个 文件 被 请 求 的 n 个 时 间 惟 ,确定 该 文件 没有 被 请 求 
的 最 大 时 间 间 隔 。 编 写 一 个 程序 以 线性 时 间 解 决 这 个 问题 。 

无 前 缓 编码。 在 数据 压缩 中 ， 如 果 没 有 字符 串 是 另 一 个 字符 串 的 前 缀 ,那么 这 组 字符 串 是 无 
前 组 的。 例如 ， 字 符 串 集合 {01,10,0010,1111} 是 无 前 绥 的 ， 但 字符 串 集合 {01,10,0010,1010} 
不 是 无 前 缀 的 ， 因 为 10 是 1010 的 前 级 。 请 编写 一 个 程序 ， 从 标准 输入 中 读 取 二 组 字符 串 ， 
并 确定 该 字符 串 组 是 否 为 无 前 缀 编码 。 

分 区 。 请 设计 一 个 线性 时 间 算 法 ， 以 对 已 知 最 多 包含 两 个 不 同 值 的 Compaiable 对 象 数 组 进行 
排序 。 提 示 : 使 用 两 个 指针 ， 一 个 从 左 端 开始 向 右 移动 ， 另 一 个 从 右 端 开始 向 左 移动 。 保 持 
左 指针 左 侧 的 所 有 元 素 等 于 两 个 值 中 较 小 的 一 个 ， 并 且 右 指针 右 侧 的 所 有 元 素 等 于 两 个 值 中 
较 大 的 一 个 。 

半 兰 国旗 问题 。 设 计 一 个 线性 时 间 算 法 ， 对 已 知 最 多 有 三 个 不 同 值 的 Comparable 对 象 数 组 进 
行 排序 。( Edsgar Dijkstra 将 此 称 为 荷兰 国旗 问题 ， 因 为 该 结果 是 很 像 国旗 中 三 个 条 纹 那样 的 
三 个 值 。) 

快速 排序 。 编 写 一 个 递归 程序 ， 使 用 之 前 练习 中 描述 的 分 治 算法 作为 子 例 程 ， 对 Comparable 
对 象 进 行 排序 : 首先， 选择 一 个 随机 元 素 v 作 为 分 区 元 素 。 接 下 来 ， 将 数组 划分 为 包含 小 于 v 
的 所 有 元 素 的 左 子 数组 ， 由 包含 所 有 等 于 v 的 元 素 组 成 的 中 间 子 数组 ， 以 及 包含 大 于 vi 的 所 有 
元 素 的 右 子 数组 。 最 后 ， 对 左右 子 数 组 进行 递归 排序 。 

反 转 域名 。 编 写 一 个 程序 ， 从 标准 输入 中 读 取 一 系列 域名 ， 并 按 顺 序 输出 其 反 向 域名 。 例如 ， 
域名 cs.princeton.edu 的 反 向 域名 是 edu.princeton.ces。 此 计算 适用 于 Web 日 志 分 析 。 为 此 ， 请 
创建 一 个 实现 Comparable 接口 的 数据 类 型 Domain (使 用 反 向 域名 顺序 存储 域名 信息 )。 

数组 中 的 局 部 最 小 值 。 给 定 一 个 包含 n 个 实数 的 数组 ， 设 计 一 个 对 数 时 间 算 法 ， 以 查找 一 个 
局 部 最 小 值 (一 个 索引 i， 使 得 a[i]<a[i-1] 和 a[i]<a[i+1])。 

离散 分 布 。 设 计 一 个 快速 算法 ， 反 复生 成 离散 分 布 的 数字 ; 给 定 一 个 和 为 1 的 非 负 实数 组 
成 的 数组 a， 目 标 是 以 概率 a[i] 返回 索引 i。 构 造 一 个 累积 和 的 数组 sum[]，sum[i] 是 af] 的 
前 i 个 元 素 的 和 。 现 在 ， 生 成 一 个 0 到 1 之 间 的 随机 实数 r， 并 使 用 二 分 查找 来 返回 满足 
sum[i] 硅 r<sum[i+1] 的 索引 1。 将 这 种 方法 的 性 能 与 RandomSurfer (程序 1.6.2 ) 中 采用 的 方法 
进行 比较 。 

隐 含 波动 率 。 通 常 ， 波 动 率 是 布莱克 - 斯 克 尔 斯 公式 中 的 未 知 值 (参见 练习 2.1.28 )。 编 写 
一 个 程序 ， 从 命令 行 读 取 s、x、r、t 和 欧式 看 涨 期 权 的 当前 价格 等 参数 ， 并 使 用 三 分 查找 法 
来 计算 o。 

渗透 阅 值 。 写 一 个 Percolation (程序 2.4.1 ) 的 客户 程序 ， 使 用 二 分 查找 法 来 估计 渗透 阔 值 。 


4.3 ” 栈 和 队列 


在 本 节 ， 我们 将 介绍 两 个 相互 关联 的 数据 类 型 栈 和 队列 ， 它 们 都 可 以 来 处 理 任意 大 小 
的 对 象 集合 。 栈 和 队列 都 是 集合 的 一 些 具体 实现 。 我 们 将 集合 中 的 对 象 称 为 数据 项 ( item)。 一 
个 集合 具有 四 个 基本 操作 : 创建 一 个 集合 、 插 入 一 个 项 、 删 除 一 个 项 ， 以 及 测试 集合 是 否 为 空 。 
当 我 们 将 一 个 项 插入 一 个 集合 中 时 ， 目 的 是 明确 的 。 但 是 当 删 除 一 个 项 时 ， 应 该 删除 哪 
一 个 呢 ? 每 种 类 型 的 集合 的 删除 规则 决定 了 它 的 特征 ， 并且 每 种 集合 也 有 针对 不 同性 能 要 求 
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的 实现 。 在 现实 生活 中 ， 你 已 经 遇 到 过 很 多 种 不 同 的 集合 和 数据 项 的 删除 方式 ， 只 是 你 还 没 
有 意识 到 。 

例如 ， 队 列 的 删除 规则 是 总 是 删除 集合 中 存在 最 长 时 间 的 项 。 这 种 策略 称 为 “先进 先 
出 ”(First In First OQut，FIFO)。 人 们 排队 买 票 就 是 遵循 这 一 原则 : 队列 按 到 达 顺 序 排列 ， 因 
此 离开 队列 的 人 比 其 他 人 排队 的 时 间 长 。 

栈 的 删除 规则 则 是 一 个 完全 不 同 的 策略 : 总 是 删除 进入 集合 时 间 最 短 的 项 。 这 个 策略 被 
称 为 “后 进 先 出 ”(Last In First Out，LIFO)。 例 如 ， 当 进入 和 离开 飞机 客舱 时 遵循 的 策略 接 
近 于 后 进 先 出 : 靠近 船舱 前 部 的 人 登 机 最 晚 但 离开 最 早 。 

栈 和 队列 的 应 用 十 分 广泛 ， 因 此 ， 熟 悉 其 基本 属性 以 及 每 种 适用 的 场景 十 分 重要 。 它 们 
都 是 可 以 用 来 解决 更 高 级 别 编程 任务 的 基本 数据 结构 。 它 们 被 广泛 应 用 于 系统 和 应 用 程序 设 

566| 计 , 在 本 节 和 4.5 节 的 几 个 例子 中 会 涉及 。 

下 推 栈 下 推 栈 (或 者 简称 为 栈 ) 是 一 种 基于 后 进 先 出 (LIFO) 策略 的 集合 。 

LIFO 策略 是 经 常 使 用 的 几 个 计算 机 应 用 程序 的 基 
础 。 例 如， 许多 人 把 电子 邮件 作为 一 个 栈 来 组 织 ， 当 接 “文本 SN 
收 到 一 个 新 邮件 时 ， 会 把 它 放 在 最 上 面 ， 位 于 最 上 面 的 
邮件 先 被 处 理 ， 即 最 近 的 日 期 优先 〈 后 进 先 出 )。 这 个 策 


略 的 优点 是 我 们 可 以 尽快 看 到 新 的 邮件 ， 缺 点 是 如 果 不 。 Push(-A ) 人 
清空 堆栈 ， 一 些 旧 的 邮件 可 能 永远 不 会 被 阅读 。 放 在 顶部 

浏览 网 页 时 ， 可 能 还 会 遇 到 另 一 种 类 型 的 栈 的 应 一 
用 。 当 点 击 一 个 超 链接 时 ， 浏 览 器 会 显示 一 个 新 页 面 | 入 . 革 
(并 将 其 插入 一 个 栈 中 )。 继 续 点 击 超 链接 可 访问 新 页 面 ， "< ) (a ) 
但 可 以 随时 通过 点 击 后 退 按钮 (从 栈 中 删除 ) 重新 访问 放 在 顶部 
上 一 页 。 下 推 栈 提供 的 后 进 先 出 策略 正 是 你 所 期 望 的 3 
行为 。 

这 些 栈 的 使 用 方法 非常 直观 ， 但 也 许 不 太 有 说 ， bop0 1 
服 力 。 事 实 上 ， 栈 在 计算 中 是 一 种 重要 而 基础 的 数据 删除 黑色 的 
结构 ， 但 我 们 在 本 节 的 后 半 部 分 再 探讨 它 的 应 用 。 目 2 
前 ,我 们 的 目标 是 理解 栈 的 工作 方式 ， 以 及 学 会 如 何 实 

栈 从 计算 机 出 现 的 早期 就 被 广泛 使 用 。 按 照 传统 ， RS 
我 们 把 栈 中 插入 项 的 操作 命名 为 push (又 称 入 栈 、 压 栈 
等 )， 栈 删除 操作 命名 为 pop (又 称 出 栈 或 弹出 )， 栈 数据 下 推 栈 操作 示意 图 


类 型 的 API 如 下 所 示 : 


public class *StackOfStrings 





*StackOfStrings() 新 建 一 个 空 栈 
boolean isEmpty() 栈 是 否 为 空 
void push(String item) 将 一 个 字符 串 进 栈 
String popO) 删除 并 返回 最 近 插 入 的 字符 串 


字符 串 下 推 栈 的 API 
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星 号 表示 我 们 将 讨论 这 个 API 的 多 种 实现 (我 们 在 本 节 中 讨论 三 个 : ArrayStackOf- 
Strings、LinkedStackOfStrings 和 ResizingArrayStackOfStrings)。 这 个 API 中 还 包含 了 一 个 方 
法 来 测试 堆栈 是 否 为 空 ， 建议 客户 程序 在 调用 pop() 等 方法 之 前 使 用 isEmpty0 来 检查 ， 以 避 
免 为 空 栈 调用 了 这 些 操作 方法 。 

这 个 API 有 一 个 严重 的 限制 ， 使 得 在 应 用 程序 中 并 不 方便 使 用 : 我 们 希望 有 一 个 包含 
多 种 数据 类 型 的 栈 ， 而 不 仅仅 是 字符 串 。 我 们 将 在 本 节 稍 后 描述 如 何 消除 这 个 限制 (以 及 这 
么 做 的 重要 性 )。 

数组 实现 ”用 数组 表示 堆栈 是 一 个 很 自然 的 想法 ， 但 在 进一步 阅读 之 前 ， 我 们 有 必要 思 
考 如 何 实现 类 ArrayStackOfStrings。 

我 们 遇 到 的 第 一 个 问题 可 能 是 如 何 实现 构造 聘 数 ArrayStackOfStrings()。 显 然 ， 你 需要 
一 个 实例 变量 、 字 符 串 数组 items[] 来 保存 栈 的 各 个 项 ;但 该 数组 应 该 有 多 大 ? 一 种 解决 方 
案 是 先 初始 化 一 个 长 度 为 0 的 数组 ， 并 确保 数组 长 度 始终 等 于 栈 的 大 小 ， 但 该 解决 方案 需要 
在 每 个 push() 和 pop( 操作 时 分 配 一 个 新 的 数组 并 将 所 有 的 项 复制 到 其 中 。 其 实 这 样 做 非常 
低 效 和 烦琐 ,而 且 也 没有 必要 。 为 了 简单 解决 这 个 问题 ,我们 可 以 通过 让 客户 程序 为 构造 函 
数 提供 一 个 参数 ， 用 于 表示 栈 的 最 大 项 个 数 。 

我 们 的 下 一 个 问题 是 数据 项 的 顺序 。 我 们 可 能 会 源 于 自然 的 想法 ,将 数组 中 的 n 个 项 按 
插入 顺序 保存 ， 其 中 最 近 插 入 的 项 在 item[0] 位 置 ， 最 早 插入 的 项 在 item[n-1] 位 置 。 但 是 ， 
每 次 调用 push 或 pop 时， 都 必须 移动 所 有 其 他 项 以 反映 栈 的 新 状态 。 更 简单 、 更 有 效 的 方 
法 是 将 项 目 按 相反 的 顺序 保存 ， 即 将 最 近 插 入 的 项 保存 在 item[n-1] 中 ， 最 早 插入 的 保存 在 
item[0] 中 。 这 个 策略 使 得 能 够 在 数组 的 末尾 添加 和 删除 项 ， 而 不 移动 数组 中 的 任何 其 他 项 。 

几乎 没有 比 ArrayStackOfStrings (程序 4.3.1 ) 中 的 栈 更 简单 的 实现 了 一 一 所 有 方法 都 
只 用 一 行 代 码 实现 ! 实例 变量 是 一 个 保存 栈 中 项 的 数组 items[]， 以 及 对 栈 中 项 的 数量 进行 
计数 的 整数 n。 要 删除 一 个 项 目 ， 我们 递减 n， 然 后 返回 item[n]; 如 果 要 插入 一 个 新 的 项 目 ， 
我 们 设置 item[n] 等 于 新 的 项 ， 然 后 增加 n。 上 述 操作 还 有 以 下 属性 : 

。 堆栈 中 的 项 数 为 n。 

。 当 nn 为 0 时 ， 栈 为 空 。 


。 栈 中 的 项 按 插 入 顺序 存储 在 数组 中 。 Stdln SdOnt nO 

。 最 近 插 入 的 项 (如 果 堆 栈 是 非 空 的 ) 是 0 

item[n—1]。 to 1 to 

像 往常 一 样 ， 使 用 一 个 常量 序列 来 推演 这 x 
个 过 程 ， 是 验证 我 们 的 实现 是 否 与 预期 相 一 致 _ niot 一 
的 一 种 最 简单 的 方法 。 请 你 一 定 要 完全 理解 这 to 5 to be or not to 
段 代 码 实 现 的 原理 。 为 了 帮助 你 理解 , 也 许 最 - tt 4 to be or not to 
好 的 方法 就 是 分 析 一 系列 pushO 和 popO 操作 ,5 9 7 or 
后 栈 内 容 的 跟踪 信息 。ArrayStackOfStrings 的 - not 3 to be or not be 
测试 客户 程序 允许 使 用 任意 的 操作 序列 进行 测 。 that 4 to be or that be 
试 : 对 标准 输入 中 的 每 个 字符 串 进行 PushO ( 除 。 
了 前 面 带 减 号 的 字符 申 )， 对 减 号 字符 为 第 一 个 ，。 .po i be: br that be 
字符 的 字符 串 则 执行 pop0 操作 。 is 2 tae “15 /Of HD 


这 种 实现 的 主要 特点 是 push 和 pop 操作。 ArrayStackOfStrings 的 测试 客户 程序 的 跟踪 信息 
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运行 时 间 是 常量 。 缺点 是 它 要 求 客 户 程序 提前 估计 栈 的 最 大 大 小 ， 并 且 使 用 的 空间 总 是 与 这 
个 最 大 值 成 正比 ， 这 在 某 些 情况 下 可 能 并 不 合理 的 。 在 push() 的 代码 中 ,我 们 省 略 了 检测 栈 
是 否 已 经 存 满 的 代码 。 在 稍 后 给 出 的 实现 中 ,我 们 将 用 一 种 新 的 方法 来 弥补 这 个 缺陷 ， 设 计 
一 种 不 会 被 填 满 的 栈 (除非 在 极端 的 情况 下 Java 没有 可 用 的 内 存 空间 )。 














程序 4.3.1 字符 串 (数组 ) 栈 


public class ArrayStackOfStrings 


private String[] items; 
private int n = 0; 


public ArrayStackOfStrings(int capacity) 
{ items = new String[capacity]; } 


public boolean isEmpty() 
{ return (n == 0); } items[] 栈 的 项 
n 


public void push(String item) 
items[n-1] 


{ items[n++] = item; } 
public String pop©O 
{ return items[--n]; } 


项 数 
最 近 插 入 的 项 






















public static void main(String[] args) 
{ /按照 设 定 的 容量 创建 一 个 栈 ， 并 按照 标准 输入 的 指令 

/ 进行 字符 串 的 push 或 pop 操 作 

int cap = Integer.parseInt(args[0]); 

ArrayStackOfStrings stack = new ArrayStackOfStrings(cap); 
while (!StdIn.isEmpty()) 
{ 





String item = StdIn.readString(); 

if (!item.equals("-")) 
stack.push(item); 

else 


StdOut.print(stack.pop() + " "); 








如 本 代码 所 示 ， 栈 方法 可 以 用 单行 代码 实现 。 客 户 程序 按照 标准 输 六 的 
指示 调用 push 或 pop 字 符 串 ( 减 号 表示 pop， 任 何其 他 字符 串 表 示 push ) 。pushO 
中 省 略 了 用 来 测试 堆栈 是 否 已 满 的 代码 〈 见 正文 ) 。 








% more tobe.txt 
to be or not to - be - - that - - - is 


% java ArrayStackOfStrings 5 < tobe.txt 
to be not that or be 


链表 在 设计 集合 (如 栈 和 队列 ) 时 ， 一 个 重要 的 目标 是 确保 所 使 用 的 内 存量 与 集合 中 
的 项 数 成 正比 。ArrayStackOfStrings 中 实现 的 栈 使 用 固定 长 度 的 数组 ， 因 而 难以 实现 这 个 目 
标 ， 特 别 是 当 栈 为 空 或 几乎 为 空 时 ， 这 种 方式 可 能 会 浪费 大 量 的 内 存 。 此 属性 使 得 通过 固定 
长 度数 组 实现 栈 难 以 适合 许多 应 用 程序 。 现 在 我 们 使 用 一 个 称 为 链表 (linked list) 的 基本 数 
据 结构 ， 基 于 它 来 完成 集合 (特别 是 栈 和 队列 ) 的 实现 ， 从 而 实现 本 段 开 头 所 提出 的 目标 。 

一 个 单 链表 中 包含 了 一 个 节点 的 序列 ， 每 个 节点 包含 一 个 对 其 后 继 者 的 引用 (或 链接 )。 
按照 规定 ， 最 后 一 个 节点 的 链接 为 null， 以 表示 链表 终止 。 其 中 ， 节 点 是 一 个 抽象 实体 ， 它 
包括 了 两 部 分 ， 一 部 分 是 用 于 构建 链表 结构 的 链接 ， 此 外 还 可 以 用 来 保存 任何 类 型 的 数据 。 
当 跟 踪 使 用 链表 和 其 他 链接 结构 的 代码 时 ， 我 们 使 用 一 种 可 视 化 的 表示 方法 : 


。 绘制 一 个 矩形 来 表示 每 个 链表 节点 。 
。 把 数据 项 和 链接 放 在 矩形 内 。 


擎 法 而 数 据 结 欧 331 


。 使 用 一 个 箭头 指向 被 引用 的 对 象 来 表示 链接 的 引用 关系 。 


first 






链接 


单 链表 的 剖析 





最 后 链接 为 空 


这 种 可 视 化 的 表示 方式 表达 了 链表 的 基本 特征 ， 并 将 焦点 放 在 链接 上 。 例 如 ， 上 图 中 展 
示 了 一 个 单 链 表 ， 其 中 包含 了 to、be、or、not、to 和 be 几 个 单词 组 成 的 序列 。 

使 用 面向 对 象 程序 设计 实现 链表 并 不 困难 。 我 们 为 本 质 上 递归 的 节点 抽象 定义 了 一 个 
类 。 与 递归 函数 一 样 ， 递 归 数 据 结 构 的 概念 起 初 可 能 有 点 让 人 难以 理解 。 


class Node 

{ 
String item; 
Node next; 


} 


一 个 Node 对 象 有 两 个 实例 变量 : 一 个 String 和 一 个 Node。String 实例 变量 是 想 用 链表 


存储 的 任何 数据 的 占 位 符 (可 以 使 用 任何 一 组 实例 变量 来 替代 )。Node 类 型 的 实例 变量 next 
描述 了 数据 结构 的 链接 性 质 : 它 用 于 存储 链表 中 后 续 节 点 的 引用 (或 用 null 以 表示 没有 后 续 
节点 )。 通 过 使 用 这 个 递归 定义 ,我 们 就 可 以 用 Node 类 型 的 变量 来 表示 一 个 链接 ， 其 中 这 
个 变量 的 next 只 有 两 种 情况 ， 或 者 其 值 为 null， 或 者 存储 的 是 对 下 一 个 Node 类 型 变量 的 引 


用 ,而 这 个 变量 的 next 域 也 可 能 指向 其 他 链表 。 


为 了 强调 只 是 使 用 Node 类 来 表示 数据 结构 ， 我 们 不 为 它 定 义 任何 实例 方法 。 与 任何 类 


一 样 ， 我 们 可 以 通过 new Node() 调用 (无 参数 ) 构造 函 
数 来 创建 Node 类 型 的 对 象 ， 这 个 函数 返回 一 个 新 的 
Node 对 象 ， 它 的 实例 变量 都 被 初始 化 为 默认 值 null。 

例如 ， 要 建立 一 个 包含 to、be 和 or 的 链表 ， 我 们 
首先 为 每 个 项 创建 一 个 Node: 


Node first = new Node(QO); 
Node second = new Node(); 
Node third = new Node(); 


并 将 每 个 Node 对 象 中 的 item 实例 变量 赋予 所 需 的 值 : 
first.item, wtor": 


second.item = "be"; 
third.item = "or"; 


然后 通过 指定 其 实例 变量 next 来 构建 链表 : 


first.next = second; 
second.next = third; 


结果 是 ，first 是 对 三 节点 链表 中 第 一 个 节点 的 引用 ， 


Node first = new NodeQO); 
first.item = "to"; 


first 





Node second = new NodeO; 
second.item = "be"; 
first.next = second; 


first second 
gE | 






Node third = new NodeO; 
third.item = "or"; 
second.next = third; 


first 






、 eco F: 
链表 各 节点 相 链 接 的 示意 图 
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second 是 对 第 二 个 节点 的 引用 ，third 是 对 最 后 一 个 节点 的 引用 。 下 图 的 代码 会 执行 相同 的 
赋值 语句 ; 只 是 顺序 不 同 。 

链表 可 以 用 于 表示 一 系列 数据 项 。 在 上 述 例子 中 ，first 表 示 to、be 和 or 的 序列 。 或 者 ， 
我 们 也 可 以 使 用 数组 表示 与 上 例 相 同 的 字符 串 序列 。 例 如 ， 我 们 可 以 使 用 
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表示 相同 的 序列 。 这 两 者 的 不 同 之 处 在 于 ， 使 用 链 ”将 链 玫 中 的 第 一 个 节点 的 引用 保存 来 
表 将 项 插入 序列 中 及 从 序列 中 删除 项 更 为 容易 。 接 
下 来 ， 我 们 讨论 实现 这 两 个 任务 的 代码 。 

假设 我 们 需要 向 链表 中 插入 一 个 新 的 节点 。 最 
简单 的 方式 是 在 链表 的 头 部 进行 操作 。 例 如 ， 要 在 “iukald As 
第 一 个 节点 为 first 的 给 定 链表 的 开始 位 置 插入 一” first = new NodeO; 
个 字符 串 not， 先 将 first 节点 保存 在 一 个 临时 变量 ™ 
oldFirst 中 ， 然 后 创建 一 个 新 的 Node 对 象 ， 其 item 
实例 变量 设置 为 not，next 实例 变量 赋值 为 oldFirst。 

现在 ， 假 设 要 从 链表 中 出 除 第 一 个 节点 。 此 操 
作 更 加 简单 : 只 需 先 将 first 赋值 给 first.next。 通 firstnext = oldFirst; 
常 ， 在 这 个 操作 之 前 ， 一 般 先 保存 该 节点 的 item 信 。 we Fe 
(把 它 赋值 给 某 个 变量 )， 因 为 一 旦 更 改 了 first 变量 ， Te 汉王 
可 能 无 法 再 访问 该 节点 了 。 通 常 ， 该 节点 对 象 变 成 在 链表 的 开始 处 插入 新 节点 
了 孤立 对 象 ， 它 占用 的 内 存 最 终 会 由 Java 内 存 管理 
系统 回收 。 

在 链表 的 头 部 插入 和 删除 一 个 节点 的 代码 仅仅 
涉及 一 些 赋值 语句 ， 因 此 其 操作 时 间 为 常量 《与 列 pe 
表 的 长 度 无 关 )。 如 果 有 指向 列表 任意 位 置 的 节点 上 三 车 3 让 
引用 ， 则 可 以 使 用 同样 的 方法 (其 实 会 稍微 复杂 一 ES 
些 ) 在 该 节点 之 后 移 除 或 插入 一 个 节点 ， 且 操作 时 sn 
间 为 常量 。 这 些 实 现 会 被 留 作 练习 (参见 练习 4.3.24 和 练习 4.3.25 )， 因 为 在 链表 头 部 插入 
和 移 除 节 点 是 实现 栈 所 需 的 唯一 操作 。 

用 链表 实现 栈 。LinkedStackOfStrings (程序 4.3.2 ) 使 用 链表 来 实现 一 个 字符 串 栈 ， 使 
用 的 代码 比 使 用 固定 长 度数 组 的 基本 解决 方案 略 多 。 

实现 的 代码 中 使 用 了 一 个 谱 套 类 Node, 等 同 于 我 们 前 面 使 用 过 的 Node 类 。 Java 允许 以 
这 种 自然 的 方式 ， 在 类 中 定义 和 使 用 其 他 类 。 该 类 是 私有 的 ( private)， 因 为 客户 程序 不 需 
要 知道 链表 的 任何 细节 。 私 有 嵌 套 类 的 一 个 特点 是 ， 它 的 实例 变量 可 以 在 定义 的 类 中 直接 访 
问 ， 但 是 不 能 在 类 以 外 的 其 他 地 方 访问 ， 因 此 不 需要 将 Node 实例 变量 显 式 地 声明 为 public 
或 private (但 这 样 做 没有 坏处 )。 

LinkedStackOfStrings 本 身 只 包含 一 个 实例 变量 : 一 个 链表 的 引用 ， 用 于 存储 栈 中 的 项 。 
这 个 引用 足以 用 来 直接 访问 栈 项 部 的 项 ， 同 时 提供 了 访问 栈 中 的 其 他 项 目 所 需要 的 push() 和 
pop()。 同 样 ， 请 你 一 定 要 完全 理解 这 段 代码 实现 的 原理 一 一 这 是 使 用 链表 结构 的 其 他 几 种 
实现 的 原型 (我 们 将 在 本 章 后 面 介绍 这 些 实现 方式 的 细节 )。 使 用 抽象 的 可 视 化 列表 表示 来 


oldFirst 








设计 新 节点 中 的 实例 变量 







first = first.next; 
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追踪 代码 是 分 析 和 理解 代码 原理 最 好 的 方法 。 

链表 遍历 。 我 们 在 集合 上 执行 的 最 常见 操作 之 一 就 是 遍历 集合 中 的 项 目 。 例 如 ， 我 
们 期 望 实现 每 个 Java API 中 固有 的 toString0O 方法 ， 以 便 通过 跟踪 来 调试 栈 的 代码 。 对 于 
ArrayStackOfStrings， 这 个 实现 非常 简单 。 574 


程序 4.3.2 字符 串 (链表 ) 栈 
public class LinkedStackOfStrings 
€ 


private Node first; first | 链表 的 第 
private class Node 


String item; item | 链表 项 天 
Node next; next | 链表 的 下 一 个 节点 


public boolean isEmpty(O) 
{ return (first == null); } 


public void push(String item) 

{ /W 在 链表 开始 处 插入 新 节点 
Node oldFirst = first; 
first = new Node(); 
first.item = item; 
first.next = oldFirst; 


public dt popO) 

{ / 从 链表 中 移 除 第 一 个 节点 并 返回 项 
String item = first.item; 
first = first.next; 
return item; 


public static void main(String[] args) 
{ 


LinkedStackOfStrings stack = new LinkedStackOfStrings(); 
} 1/ 测试 客户 程序 见 程序 4.3.1 
} 


在 此 栈 实现 中 ,使 用 私有 嵌 套 类 Node 作 为 基础 实现 了 一 个 Node 对 象 的 链 
表 ， 并 用 它 来 表示 一 个 栈 。 实 例 变 量 first 指 向 链表 中 的 第 一 个 (最 近 插 入 的 ) 
Node 对 象 。 每 个 Node 对 象 中 的 实例 变量 next 指 向 下 一 个 Node 节 点 (最 后 一 个 
ri ) 。 不 需要 显 式 构造 函数 ， 因 为 Java 默 认 将 实例 变量 初始 
null。 


% java LinkedStackOfStrings < tobe.txt 
to be not that or be 
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to | to | 


be | be | 
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上 述 解 决 方案 仅 适用 于 n 较 小 的 情况 ， 因 为 每 个 字符 串 的 连接 都 需要 线性 时 间 ， 因 此 总 
共 需 要 二 次 量 级 时 间 。 

我 们 现在 只 关注 于 检查 每 个 数据 项 的 过 程 。 访 问 链表 中 的 项 有 一 个 相应 的 习惯 用 法 : 
我 们 初始 化 一 个 循环 索引 变量 x， 让 它 指向 链表 的 第 一 个 Node ; 然后 ， 通 过 访问 x.item 以 
获取 x 所 指向 的 项 的 值 ， 然 后 更 新 x 来 指向 链表 中 的 下 一 个 Node， 即 把 x 赋值 为 x.next， 
重复 这 个 过 程 ， 直 到 x 为 null (这 表明 已 经 到 达 链 表 的 末尾 )。 这 个 过 程 被 称 为 链表 遍历 
(traversing)， 在 LinkedStackOfStrings 的 toString() 实现 中 简洁 地 表达 了 这 个 过 程 : 


public String toString() 


String s= "" 

for (int i = 0; 1 < n; i++) 
s+= ari] +”" 

return s; 


一 旦 你 开始 经 常 使 用 链表 进行 编程 ， 这 个 习惯 用 法 将 变 得 像 我 们 迭代 访问 数组 元 素 的 代 
码 一 样 常用 。 在 本 节 的 最 后 ,我们 会 讨论 迭代 器 的 概念 ， 它 允许 我 们 编写 客户 程序 代码 来 遍 
历 集 合 中 的 项 ， 而 无 须 在 这 个 细节 寺 上 进行 编程 。 

借助 栈 的 链表 实现 ， 我 们 可 以 实现 栈 中 使 用 大 量 数据 项 的 客户 程序 ， 而 不 必 担 心 内 存 
的 使 用 。 同 样 的 原则 适用 于 各 种 类 型 的 集合 ， 因 此 链表 被 广泛 应 用 于 程序 设计 中 。 事 实 上 ， 
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Java 内 存 管 理 系 统 的 典型 实现 就 是 维护 了 一 个 内 存 块 的 链表 ， 其 中 的 每 一 项 对 应 于 各 种 大 小 
的 内 存 块 。 在 像 Java 这 样 的 高 级 语言 被 广泛 使 用 之 前 ， 内 存 管 理 的 细节 和 链表 的 编程 实现 
往往 是 任何 程序 员 需 要 考虑 的 关键 问题 。 在 现代 系统 中 ， 这 些 细节 大 多 被 封装 在 一 些 数据 类 
型 的 实现 中 ， 比 如 本 节 的 下 推 栈 ， 以 及 后 面 会 讲 到 的 队列 、 符 号 表 和 集合 等 。 如 果 你 还 学 习 
了 算法 和 数据 结构 课程 ， 那 你 还 会 学 到 其 他 更 多 的 数据 类 型 ， 并 且 需 要 亲自 动手 创建 和 调试 
处 理 链表 的 程序 。 目 前 ， 你 可 以 将 注意 力 集中 在 理解 链表 在 实现 这 些 基 本 数据 类 型 时 的 作用 
上 。 对 于 栈 来 说 ， 链 表 非 常 重要 ， 因 为 这 人 允许 在 常量 时 间 内 实现 push() 和 pop() 方法 ， 同 时 
只 使 用 一 个 小 的 常数 因子 的 额外 空间 (用 于 存储 next 引用)。 





链表 的 遍历 


可 变数 组 ” 接 下 来 ,我 们 考虑 一 种 替代 方法 ， 以 适应 任意 增长 和 收缩 的 数据 结构 ， 这 是 
一 个 非常 有 吸引 力 的 数据 结构 ， 是 替代 链表 的 一 个 很 好 的 选择 。 同 链表 一 样 ， 我 们 现在 介绍 
这 种 方法 是 因为 在 实现 栈 的 过 程 中 理解 它 的 原理 并 不 困难 ， 而 这 种 数据 结构 本 身 非常 重要 ， 
在 实现 比 栈 更 复杂 的 数据 类 型 时 能 发 挥 更 加 重要 的 作用 。 

这 个 想法 即 修改 基于 数组 的 实现 (程序 4.3.1 )， 动态 地 调整 数组 items[] 的 长 度 ， 使 其 可 
以 足够 大 ， 从 而 容纳 所 有 的 数据 项 ; 也 可 以 在 项 数 较 少 时 压缩 长 度 ， 不 会 浪费 过 多 的 内 存 。 
在 ResizingArrayStackOfStrings (程序 4.3.3 ) 的 代码 中 可 以 看 到 ， 实 现 这 些 目标 并 不 困难 。 

首先 ， 在 push() 中 检查 数组 是 否 太 小 。 具 体 来 说 ， 我 们 通过 检查 栈 大 小 6 是 否 等 于 
数组 长 度 items.length， 以 检查 数组 中 是 否 有 空间 容纳 新 数据 项 。 如 果 有 ， 则 用 代码 items 
[n++]=item 将 新 项 插入 ; 如 果 没 有 ， 我 们 创建 一 个 长 度 是 原 数 组 两 倍 的 新 数组 ， 并 将 原来 栈 
中 的 项 复制 到 新 数组 中 ， 重 置 items[] 实例 变量 使 其 引用 新 数组 ， 从 而 使 数组 的 长 度 加 倍 。 

类 似 地 ， 在 pop() 中 ,我们 首先 检查 数组 是 否 太 大 ， 如 果 是 ， 就 将 其 长 度 减 半 。 简 单 考 
虑 一 下 ， 你 就 会 想到 这 里 应 该 做 的 检查 是 栈 的 大 小 是 否 小 于 数组 长 度 的 1/4。 然 后 ,在 数组 
减 半 之 后 其 状态 大 约 半 满 ， 因 此 可 以 容量 一 定量 的 push() 和 pop0( 操作 ， 而 不 必 频 繁 改 变数 
组 的 长 度 。 这 个 特性 非常 重要 。 例 如 ， 如 果 使 用 的 策略 是 在 栈 大 小 为 数组 长 度 一 半 时 将 数组 
减 半 ， 那 么 生成 的 数组 会 是 满 的 ， 这 意味 着 如 果 下 一 个 操作 是 push()， 就 会 立即 需要 将 数组 
长 度 加 倍 ， 那 么 这 样 的 机 制 就 导致 系统 陷 人 一 个 开销 巨大 的 加 倍 和 减 半 的 循环 中 。 
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程序 4.3.3 字符 串 ( 可 变数 组 ) 栈 


public class ResizingArrayStackOfStrings 


private String[] items = new String[1]; items[] | 栈 中 项 
private int n = 0; n 栈 中 项 数 


public boolean isEmpty©O 
{ return (n 0); 上 


private void resize(int capacity) 

{ V 把 栈 中 元 素 移 到 一 个 指定 容量 的 新 数组 中 
String[] temp = new String[capacity]; 
for (int i = 0: 1 rn 和) 

temp[i] = items[i]; 
items = temp; 


public void push(String item) 

{ / 将 数据 项 插 六 栈 中 
if (Cn == items.length) resize(2*items.length); 
items [n++] = item; 


public String popO) 
{ V/ 将 最 近 播 六 的 元 素 删除 并 返回 
String item = items[--n]; 
items[n] =_null1; // 游 竟 数据 对 象 “ 游 离 ”( 见 正文 ) 
if (n > 0 && n == items.length/4) resize(items.length/2); 
return item; 


} 
public static void main(String[] args) 


{ 
// 见 程序 4.3.1 的 测试 客户 程序 





这 种 实现 的 目标 是 支持 任何 大 小 的 栈 , 而 且 不 会 过 度 浪费 内 存 。 它 在 栈 被 
填 满 时 将 数组 的 长 度 增加 一 倍 , 并 在 数据 项 数 减少 时 将 数组 的 长 度 减 半 以 使 其 
pr 平均 而 言 , 所 有 操作 都 只 需要 常量 时 间 (请 
参阅 正文 ) 。 


% java ResizingArrayStackOfStrings < tobe.txt 
to be not that or be 





items. items|] 
StdIn StdOut n len gth 0 1 2 3 4 5 6 7 
0 EE null 
to 1 1 to 
be 2 2 to be 
or 3 4 to be or null 
not 4 4 to be or ~ Wt 
to 5 8 to be or not to null -nul null 
= to 4 8 to be or not null null null null 
be 5 8 to be or not be null. null null 
~ be 4 8 to be or not null nul nul null 
= not 8 8 to be or null null null null null 
that 4 8 to be or that nl nl null -nul 
- that 3 8 to be or null nul, null nul null 
- or 2 4 to be null null 
一 be 1 2 to null 
is 2 2 to is 


ResizingArrayStackOfStrings 的 测试 客户 程序 的 跟踪 信息 
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摊 销 分 析 。 这 种 加 倍 和 减 半 的 策略 是 在 浪费 空间 (把 数组 的 长 度 设 置 得 太 大 而 留 下 空位 ) 
和 浪费 时 间 (在 每 次 插入 之 后 重新 组 织 数组 ) 之 间 的 明智 折 中 。ResizingArrayStackOfStrings 
中 的 特定 策略 保证 栈 永远 不 会 溢出 且 永 远 不 会 少 于 四 分 之 一 满 (除非 栈 为 空 ， 在 这 种 情况 下 
数组 长 度 为 1)。 如 果 你 爱好 数学 ， 可 能 会 喜欢 用 数学 归纳 来 证 明 这 个 结论 〈 见 练习 4.3.18 ) 。 
更 重要 的 是 ,我 们 可 以 证 明 ， 加 倍 和 减 半 的 成 本 总 是 能 够 被 其 他 栈 操作 的 成 本 所 吸收 (在 一 
个 常数 因子 内 )。 我 们 把 证 明 的 细节 留 作 数学 上 的 练习 ， 但 这 个 想法 很 简单 : 当 push() 将 数 
组 的 长 度 加 倍 到 n 时 ， 它 会 从 堆栈 中 的 /2 项 开始 ， 所 以 客户 程序 至 少 需 要 进行 n/2 次 额外 
的 push0 调用 (如果 中 间 调 用 了 一 些 pop() 则 更 多 )， 数 组 的 长 度 才 能 再 次 加 倍 。 如 果 我 们 将 
数组 加 倍 产生 的 开销 平均 到 这 n/2 个 push() 操作 下 ， 那 么 显然 会 得 到 一 个 常数 。 换 句 话说 ， 
在 ResizingArrayStackOfStrings 中 ， 所 有 栈 操作 的 总 开销 除 以 操作 次 数 ， 得 到 的 平均 开销 的 
上 限 会 是 一 个 常数 。 这 个 结论 并 不 像 说 每 个 操作 都 需要 一 定 的 时 间 那 样 肯定 ， 但 其 在 许多 应 
用 程序 (例如 ， 当 我 们 主要 关注 应 用 程序 的 总 运行 时 间 时 ) 中 具有 相同 的 含义 。 这 种 分 析 被 
称 为 摊 销 分 析 一 一 可 变数 组 数据 结构 是 很 有 价值 的 典型 例子 。 

孤立 项 。Java 的 垃圾 收集 策略 是 回收 不 能 被 访问 的 对 象 所 占据 的 内 存 。 在 一 开始 我 们 
实现 ArrayStackOfStrings 的 pop() 时 ， 对 弹出 项 的 引用 仍 保留 在 数组 中 。 该 项 是 一 个 孤立 
项 一 一 我 们 将 永远 不 会 在 类 中 再 次 使 用 它 ,， 要 么 是 因为 栈 将 会 收缩 ， 要 么 因为 栈 将 被 另 一 个 
引用 覆盖 〈 如 果 栈 增长 ) 一 一 但 Java 的 垃圾 回收 器 无 法 知晓 这 一 点 。 即 使 客户 程序 已 经 完成 
了 对 该 项 的 所 有 操作 ， 数 组 中 的 引用 也 可 能 使 其 保持 活跃 状态 。 这 种 情况 (保留 对 不 再 需要 
的 数据 项 的 引用 ) 称 为 “游离 "， 这 与 内 存 泄漏 不 同 (即使 内 存 管 理 系 统 没有 对 该 项 的 引用 )。 
在 这 种 情况 下 ， 游 离 是 很 容易 避免 的 。 在 ResizingArrayStackOfStrings 的 pop0 实现 中 ,将 
已 弹出 项 对 应 的 数组 元 素 设 置 为 null， 从 而 覆盖 未 使 用 的 引用 ， 使 系统 能 够 在 客户 程序 完成 
时 回收 与 弹出 项 关联 的 内 存 。 

借助 栈 的 可 变数 组 实现 〈 与 链表 实现 时 一 样 )， 我 们 可 以 编写 使 用 栈 的 客户 程序 ， 而 无 
须 担心 内 存 使 用 情况 。 同 样 的 原则 也 适用 于 任何 种 类 的 集合 。 对 于 一 些 比 栈 更 复杂 的 数据 类 
型 ， 可 变数 组 优 于 链表 ， 因 为 能 够 在 常量 时 间 内 (通过 索引 ) 访问 数组 中 的 任何 元 素 ， 这 对 
于 实现 某 些 操作 非常 重要 (例如 ， 参 见 练习 4.3.37 的 RandomQueue)。 与 链表 一 样 ， 最 好 将 
可 变数 组 代码 保存 为 基本 数据 类 型 ， 当 需要 时 你 就 可 以 在 客户 代码 中 直接 使 用 它们 。 

参数 化 的 数据 类 型 ”我 们 已 经 开发 并 实现 了 一 个 基于 特定 类 型 (字符 串 ) 的 栈 。 但 是 在 
开发 客户 程序 时 ， 常 常 需要 实现 其 他 类 型 数据 的 集合 ， 而 不 一 定 是 字符 串 。 商 业 交易 处 理 系 
统 可 能 需要 维护 客户 、 账 户 、 商 家 和 交易 的 集合 ;: 大 学 课程 安排 系统 可 能 需要 维护 班级 、 学 
生 和 房间 的 集合 ; 便携 式 音乐 播放 器 ( mp3 ) 可 能 需要 维护 歌曲 、 艺 术 家 和 专辑 的 集合 ; 一 
个 科学 数据 分 析 程 序 可 能 需要 保存 double 值 或 int 值 的 集合 。 在 你 遇 到 的 编程 任务 中 ， 你 可 
能 会 需要 维护 任何 类 型 的 数据 类 型 构成 的 集合 ， 甚 至 是 你 自己 创建 的 类 型 。 你 应 该 怎么 做 ? 
在 讨论 了 使 用 Java 语言 构造 的 两 个 简单 方法 〈 以 及 它们 的 缺点 ) 之 后 ， 我 们 将 引入 一 个 更 高 
级 的 数据 结构 ， 可 以 帮助 我 们 正确 地 解决 这 个 问题 。 

为 每 个 项 数据 类 型 创建 新 的 集合 数据 类 型 。 我 们 可 以 创建 类 StackOfInts、StackOf- 
Customers、StackOfStudents 等 ， 当 作 StackOfStrings 的 补充 。 这 种 方法 要 求 我 们 复制 每 种 数 
据 类 型 的 代码 ， 这 违反 了 软件 工程 的 基本 设计 准则 ， 我 们 应 该 尽 可 能 复 用 (而 不 是 复制 ) 代 
码 。 对 于 要 放 在 栈 上 的 每 种 类 型 的 数据 ， 我 们 都 需要 一 个 不 同 的 类 ， 因 此 ， 维 护 代码 就 变 成 
了 一 个 避 梦 : 每 当 你 想 要 或 需要 进行 更 改 时 ， 必 须 在 代码 的 每 个 版 本 中 都 这 样 做 。 尽 管 如 





此 ， 这 种 方法 仍然 被 广泛 使 用 ， 因 为 许多 编程 语言 (包括 Java 的 早期 版 本 ) 没有 提供 任何 更 
好 的 方法 来 解决 这 个 问题 。 打 破 这 个 障碍 成 为 一 个 程序 员 和 一 个 编程 环境 成 熟 的 标志 。 我 们 
是 否 可 以 只 用 一 个 类 来 实现 一 系列 字符 串 、 整 数 以 及 任何 类 型 的 栈 ? 

使 用 对 象 集合 。 我 们 可 以 开发 一 个 栈 ， 其 数据 项 都 是 Object 类 型 。 使 用 继承 ,我 们 可 
以 合法 地 压 入 任何 类 型 的 对 象 (如果 我 们 要 压 栈 一 个 Apple 数据 类 型 的 对 象 ， 这 是 一 个 合法 
操作 ， 因 为 Apple 是 Object 的 子 类 ， 其 他 类 也 是 如 此 )。 当 数据 项 弹出 栈 时 ， 我们 必须 将 其 
转换 回 正确 的 类 型 (堆栈 中 的 所 有 项 都 是 Object 类 型 ， 但 是 代码 处 理 的 是 Apple 类 型 的 对 
象 )。 总 之 ， 如 果 我 们 能 将 *StackOfStrings 实现 中 所 有 String 更 改 为 Object， 就 能 创建 一 个 
StackOfObjects 类 ， 我 们 就 可 以 编写 以 下 类 似 的 代码 来 使 用 它 : 

StackOfObjects stack = new StackOfObjects(); 


Apple a = new AppleQO); 
stack.push(a); 


i (Apple) (stack.popO)); 


这 样 做 可 以 实现 我 们 的 目标 ， 即 使 用 一 个 类 就 能 实现 对 任何 类 型 的 对 象 构 成 的 栈 的 创建 
和 操作 。 但 这 种 方法 是 不 可 取 的 ， 因 为 它 将 会 给 客户 程序 带 来 编码 错误 的 风险 ， 而 这 些 错误 
无 法 在 编译 时 检测 到 。 例 如 ， 我 们 无 法 阻止 程序 员 将 不 同类 型 的 对 象 放 在 同一 个 栈 上 ， 如 下 
例 所 示 : 


ObjectStack stack = new ObjectStack(); 

Apple a = new AppleQO); 

Orange b = new OrangeQO; 

stack.push(a); 

stack.push(b); 

a = (Apple) (stack.popQ 〇 ); // 抛 出 异常 ClassCastException 

b = (Orange) (stack.popQO); 

以 这 种 方式 进行 类 型 转换 等 于 假设 客户 程序 将 从 栈 中 弹出 的 对 象 强制 转换 为 正确 的 类 
型 ， 因 此 关闭 了 Java 类 型 系统 提供 的 保护 。 程 序 员 使 用 类 型 系统 的 一 个 原因 是 防止 由 这 种 
隐 式 假设 而 引起 的 错误 。 如 果 在 编译 时 无 法 对 代码 进行 类 型 检查 ， 那 么 在 某 些 代码 中 可 能 会 
出 现 错误 的 强制 转换 ， 这 些 代码 可 能 在 很 多 情况 下 都 可 以 正常 运行 ， 仅 在 某 些 特定 的 运行 环 
境 时 才 会 出 错 。 我 们 要 尽量 避免 这 样 的 错误 ， 因 为 这 些 错 误 可 能 在 程序 交付 给 客户 之 后 很 久 
才 出 现 ， 而 客户 完全 无 法 解决 。 

Java 泛 型 。Java 中 提供 了 一 个 名 为 “ 泛 型 ”类 型 的 特定 机 制 来 解决 我 们 所 面临 的 问题 。 
有 了 泛 型 ， 我 们 就 可 以 按照 客户 代码 指定 的 类 型 构建 对 象 集合 。 这 样 做 的 主要 好 处 是 能 够 在 
编译 时 (软件 开发 时 ) 发 现 类 型 不 匹配 错误 ， 而 不 是 在 运行 时 《〈 当 客户 程序 正在 使 用 该 软件 
时 ) 发 现 类 型 不 匹配 错误 。 从 概念 上 讲 ， 泛 型 有 点 令 人 困惑 (它们 对 编程 语言 有 足够 深刻 的 
影响 ， 甚 至 在 Java 的 早期 版 本 中 都 没有 提供 支持 )， 但 我 们 在 当前 上 下 文中 使 用 它们 时 ， 仅 
引入 了 少量 的 额外 内 容 ， 使 用 的 Java 语法 也 很 容易 理解 。 我 们 将 泛 型 类 的 栈 命名 为 Stack， 
并 为 栈 中 的 对 象 类 型 选择 通用 名 称 Item (可 以 使 用 任何 名 称 )。Stack (程序 4.3.4 ) 的 代码 与 
LinkedStackOfStrings 的 代码 基本 相同 (我 们 删 去 了 Linked 修饰 符 ， 因 为 我 们 的 实现 非常 完 
善 ， 客 户 程序 不 必 关 心 数据 的 存储 方式 )， 只 是 我 们 将 每 个 出 现 的 String 替换 为 tem， 并 使 
用 以 下 第 一 行 代码 声明 该 类 : 


public class Stack<Item> 


彰 法 和 数据 结 药 


程序 4.3.4， 泛 型 栈 
public class Stack<Item> + 
private Node first; first [链表 上 第 二 个 节点 } 
private class Node 
{ BE. item | 栈 项 
Eom next | 链表 上 的 下 一 个 节点 






Node next; 


public boolean isEmptyO) 
{ return (first == null1); } 


public void push(Item item) 
{ _/ 将 数据 项 插入 栈 中 
Node oldFirst = first; 
first = new Node(); 
first.item = item; 
first.next = oldFirst; 


i Item po 
/将 最 近 插 PP 和 0 元 来 删除 并 返回 
Item item = first.item; 
first = first.next; 
return item; 


public static void main(String[] args) 


Stack<String> stack = new Stack<String>(0) ; 


} /1 见 程序 4.3.1 的 测试 客户 程序 


这 个 代码 和 程序 4.3.2 儿 乎 是 一 样 的 ,但 是 值得 重复 ， 因 为 它 展示 了 使 用 
泛 型 来 允许 客户 程序 支持 任何 类 型 的 数据 是 多 么 容易 。 此 代码 中 的 关键 字 Item 
是 一 个 类 型 参数 ， 它 是 客户 程序 提供 的 实际 类 型 名 称 的 占 位 符 。 


% java Stack < tobe.txt 
to be not that or be 
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Item 是 一 个 类 型 参数 ， 是 客户 程序 指定 的 某 些 实际 类 型 的 占 位 符 。 可 以 将 Stack<Item> 
读 作 “ Item 的 栈 "， 这 正 是 我 们 想 要 的 。 在 实现 Stack 时 ， 我 们 不 知道 Item 的 实际 类 型 ， 但 
是 客户 程序 可 以 使 用 栈 来 处 理 任何 类 型 的 数据 ， 包 括 在 我 们 开发 完 Stack 很 长 时 间 后 才 定义 


的 数据 类 型 。 下 面 的 客户 代码 中 ,在 创建 栈 时 指定 了 Apple 类 型 参数 : 


Stack<Apple> stack = new Stack<Apple>O; 
Apple a = new Apple(); 


stack.push(a); 


如 果 你 尝试 在 堆栈 上 推送 一 个 错误 类 型 的 对 象 ， 像 这 样 : 


Stack<Apple> stack = new Stack<Apple>O; 
Apple a = new AppleQO; 

Orange b = new Orange(); 

stack.push(a); 

stack.push(b); /1 编译 时 错误 


你 会 得 到 一 个 编译 时 错误 : 


340 ”党 4 全 


push(Apple) in Stack<Apple> cannot be applied to (Orange) 


此 外 ， 在 我 们 的 Stack 实现 中 , Java 可 以 使 用 类 型 参数 Item 来 检查 类 型 不 匹配 错误 一 一 
例如 ， 即 使 尚未 知道 实际 类 型 ， 也 必须 为 Item 类 型 的 变量 分 配 Item 类 型 的 值 。 

自动 装 箱 。 像 程序 4.3.4 这 样 的 泛 型 代码 有 一 个 小 麻烦 ， 即 类 型 参数 必须 是 一 个 引用 类 
型 ， 那 么 我 们 怎样 才能 在 代码 中 使 用 基本 类 型 ， 如 int 和 double ? Java 语言 中 提供 了 自动 
装 箱 (autoboxing) 和 自动 拆 箱 . (unboxing) 机 制 ， 使 我 们 能 够 在 泛 型 代码 中 使 用 基本 类 型 。 
Java 为 每 一 个 基本 类 型 内 置 了 一 个 包装 类 型 ( wrapper type)， 其 对 应 于 boolean 、byte 、char、 
double、float、int、long 和 short 这 些 基本 类 型 ， 分 别 是 Boolean、Byte、Character、Double、 
Float、Integer、Long 和 Short。jJava 会 自动 在 这 些 引用 类 型 和 相应 的 基本 类 型 (在 赋值 语句 、 
方法 参数 和 算术 / 逻辑 表达 式 中 ) 之 间 进 行 转换 ， 以 便 我 们 可 以 编写 如 下 代码 : 


Stack<Integer> stack = new Stack<Integer>() ; 

stack.push(17); // 自动 装 箱 (int -> Integer) 

int a = stack.pop(); // 自动 拆 箱 (Integer -> int) 

在 这 个 例子 中 ， 当 我 们 将 原始 值 17 传递 给 push() 方法 时 ，Java 自动 将 其 转换 (自动 装 
箱 ) 为 Integer 类 型 。pop() 方法 返回 一 个 Integer， 在 将 其 赋值 给 变量 a 之 前 ，Java 将 其 转换 
为 int 值 。 此 功能 便于 编写 代码 ， 但 是 涉及 大 量 的 幕后 处 理 ， 会 影响 性 能 。 在 一 些 性 能 关键 
的 应 用 程序 中 ， 像 StackOfInts 这 样 的 类 还 是 很 有 必要 的 。 

泛 型 提供 了 我 们 需要 的 解决 方案 : 它们 可 以 实现 代码 复 用 ， 同 时 提供 类 型 安全 性 。 仔 细 
研究 Stack (程序 4.3.4 )， 并 确保 你 理解 每 一 行 代码 ， 这 会 在 将 来 的 编程 工作 中 给 你 很 多 帮 
助 ， 因 为 参数 化 数据 类 型 的 使 用 是 一 个 非常 重要 的 高 级 语言 编程 技巧 ， 而 Java 中 也 提供 了 
非常 完善 的 支持 。 你 不 必 成 为 专家 就 可 以 利用 这 一 强大 的 功能 。 

栈 的 应 用 “下 推 栈 在 计算 中 扮演 着 重要 的 角色 。 如 果 你 学 习 了 操作 系统 、 编 程 语言 或 者 
其 他 计算 机 科学 中 的 高 级 课题 ， 你 将 会 发 现 ， 在 许多 应 用 程序 中 ， 栈 不 仅 是 直接 使 用 的 ， 而 
且 还 被 用 作 许多 高 级 语言 程序 的 执行 基础 ， 包 括 Java 和 Python 等 。 

算术 表达 式 。 我 们 在 第 1 章 讨论 过 的 一 些 初 级 程序 中 包含 了 算术 表达 式 的 求 值 计算 ， 
例如 : 
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按照 数学 知识 ， 用 4 乘 以 5、3 加 上 2， 两 个 结果 相 乘 ， 再 加 上 1， 得 到 结果 101。 但 是 
Java 如 何 进 行 计算 呢 ? 如 果 不 深 入 了 解 Java 的 构建 原理 ， 我 们 可 以 编写 一 个 Java 程序 ， 将 
字符 串 〈 表 达 式 ) 作为 Java 程序 的 输入 ， 输 出 是 表达 式 产生 的 值 ， 并 借 此 来 讨论 其 基本 思 
想 。 为 了 简单 起 见 ， 我 们 从 下 面 的 显 式 递归 定义 开始 : 一 个 算术 表达 式 要 人 么 是 一 个 数值 ， 要 
么 是 一 个 左 括号 后 跟 一 个 算术 表达 式 ， 后 跟 一 个 运算 符 ， 后 跟 另 一 个 算术 表达 式 ， 再 后 跟 右 
括号 。 为 了 简单 起 见 ， 这 个 定义 适用 于 全 括号 (fully parenthesized) 算术 表达 式 ， 它 借助 括 
号 精确 地 指定 了 哪些 运算 符 适用 于 哪些 操作 数 ( 即 每 一 个 运算 ,无 论 优 先 级 ， 都 用 二 对 括号 
括 起 来 一 一 译 者 注 ) 一 一 我 们 对 1+2*3 这 样 的 表达 式 更 熟悉 ， 在 这 样 的 表达 式 中 我 们 利用 了 
运算 符 优先 级 规则 来 描述 计算 的 顺序 ， 而 不 是 括号 。 我 们 讨论 的 基本 机 制 可 以 处 理 优先 级 ， 
但 为 了 简单 起 见 ， 我 们 没有 考虑 这 些 情 况 。 为 了 简洁 性 ， 我 们 仅 支 持 常用 的 二 元 运算 符 *、 
+ 和 一 ， 以 及 只 有 一 个 参数 的 平方 根 运算 符 sqrt。 我 们 可 以 很 容易 地 扩展 到 更 多 的 运算 符 ， 
以 涵盖 大 量 常 用 的 数学 表达 式 ， 包 括 除 法 、 三 角 函 数 和 指数 函数 等 。 我 们 的 重点 是 理解 如 何 
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解释 括号 、 运 算 符 和 数值 的 字符 串 ， 以 便 能 够 按照 正确 的 优先 级 顺序 执行 任何 计算 机 上 都 支 
持 的 低级 算术 运算 。 

算术 表达 式 求 值 。 我 们 如 何 才 能 将 算术 表达 式 (字符 串 ) 转换 为 它 所 代表 的 值 ? 狄 克 斯 
特 拉 (Edsgar Dijkstra) 在 20 世纪 60 年 代 开 发 了 一 种 非常 简单 的 算法 ,该 算法 使 用 了 两 个 
下 推 栈 (一 个 用 于 操作 数 ， 另 一 个 用 于 运算 符 ) 来 完成 这 项 工作 。 一 个 表达 式 由 括号 、 运 算 
符 和 操作 数 〈 数 字 ) 组 成 。 该 算法 从 左 向 右 处 理 字符 串 ， 每 次 处 理 一 个 实体 ， 我 们 根据 四 种 
可 能 的 情况 操作 栈 ， 如 下 : 

。 将 操作 数 压 人 操作 数 栈 上 。 

。 将 运算 符 压 人 运算 符 栈 上 。 

。 忽略 左 括号 。 

。 在 遇 到 右 括号 时 ， 弹 出 一 个 运算 符 ， 弹 出 所 需 数量 的 操作 数 ， 用 运算 符 和 操作 数 完成 

相应 的 计算 ， 并 把 计算 结果 压 人 操作 数 栈 。 


程序 4.3.5 ”表达 式 求 值 
public class Evaluate 


ublic static void main(String[] args) Fy 
{ Ep ops “| 运算 符 栈 
Stack<String> ops = new Stack<String>(); values | 操作 数 栈 
Stack<Double> values = new Stack<Double>O; token | 当前 标记 
while (!StdIn.isEmptyO) A 当前 值 
{ 7/ 读 入 一 个 短 串 ， 若 是 运算 符 ， 则 入 栈 
String token = StdIn.readStringO; 
> (token.equals("(")) ; 
else if (token.equals("+")) ops.push(token); 
else if (token.equals("-")) ops.push(token); 
else if (token.equals("*")) ops.push(token); 
else if (token.equals("sqrt")) ops.push(token); 
else if (token.equals(")")) 
{_/ 如 果 读 到 的 是 ""， 则 弹出 , , 求 值 ， 并 将 结果 入 栈 
String op = ops.popO; 
double v = values.popO; 
Ts (op.equals("+")) Vv = values.pop(O) + v; 
else if (op.equals("-")) v= values.pop() - v; 
else if (op.equals("*")) VvV = values.pop() * v; 
else if (op.equals("sqrt")) v = Math.sqrt(v); 
values .push(v); 
} 1// 如 果 读 到 的 不 是 运算 符 ， 也 不 是 括号 , 那么 按照 double 类 型 的 数据 入 栈 
所 else values.push(Double.parseDouble(token)); 


} 
StdOut.printin(values.popO); 


} 


这 个 Stack 的 客户 程序 从 标准 输入 中 读 取 一 个 全 括号 数值 表达 式 ， 使 用 
Dijkstra 的 双 栈 算法 来 求 值 ， 并 将 结果 数字 打印 到 标准 输出 。 程 序 演示 了 一 个 
基本 的 计算 过 程 : 将 字符 曲解 释 为 程序 ”并 执行 该 程序 以 计算 出 所 需 的 结果 。 
执行 一 个 Java 程 序 只 不 过 是 这 个 过 程 的 二 个 更 复杂 的 版 本 。 


% java Evaluate java Evaluate 
Ct ta 6 DV € Lesqre tt S00 Fe 0.859 
101.0 .618033988749895 





当 最 后 一 个 右 括号 处 理 完毕 ， 栈 中 只 剩 下 一 个 值 ， 即 表达 式 的 值 。Dijkstra 的 双 栈 算法 
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起 初 看 起 来 很 神秘 ， 但 很 容易 证 明 其 计算 的 正确 性 : 只 要 算法 处 理 到 一 个 由 运算 符 分 开 的 两 


个 操作 数组 成 的 子 表达 式 〈 这 个 子 表达 式 会 被 圆 括号 包 
围 起 来 ) 时 ， 就 会 对 这 两 个 操作 数 执行 指定 的 操作 并 将 
运算 结果 压 人 操作 数 栈 ; 这 样 ， 与 运算 结果 直接 出 现在 
输入 中 (而 不 是 子 表达 式 出 现在 输入 中 ) 结果 相同 ， 因 
此 我 们 可 以 考虑 用 该 值 替 换 子 表达 式 ， 以 获得 可 以 产生 
相同 结果 的 表达 式 。 反 复 应 用 这 个 理论 直到 得 到 最 终 的 
结果 值 。 例 如 ， 该 算法 可 以 得 出 如 下 所 有 表达 式 结果 是 
相同 值 : 


程序 Evaluate( 程 序 4.3.5 ) 是 这 个 算法 的 一 个 实现 。 
此 代码 是 一 个 简单 的 解释 器 (interpreter) 示例 : 一 个 程 
序 执行 另 一 个 程序 (在 本 例 中 是 一 个 算术 表达 式 )， 一 次 
执行 一 步 或 一 行 。 编 译 器 是 一 个 将 程序 从 高 级 语言 转换 
为 可 以 完成 这 个 工作 的 低级 语言 的 程序 。 编 译 器 的 转换 
工作 是 一 个 比 解释 器 的 逐步 转换 更 为 复杂 的 过 程 ， 但 两 
者 基于 相同 的 基础 机 制 。Java 编译 器 将 Java 程序 设计 
语言 代码 翻译 成 Java 字 节 码 。 最 初 ，Java 基于 解释 器 
进行 工作 。 但 是 现在 ，Java 包含 一 个 编译 器 ， 用 于 把 算 
术 表 达 式 (更 一 般 地 说 ，Java 程序 ) 转换 为 Java 虚拟 机 
(这 是 一 个 在 真实 计算 机 上 易于 模拟 的 虚拟 机 器 ) 的 低级 
代码 。 





SO 
CC2+3)* C4*5))) 
2 
= 
[二 3)*(4*5))) 
T2313 
Ei 


Te ee 
[4 











Evaluate (程序 4.3.5 ) 的 跟踪 信息 


基于 栈 的 编程 语言 。 值 得 注意 的 是 ，Dijkstra 的 双 栈 算法 同样 可 以 计算 如 下 表达 式 ， 且 


结果 与 本 例 中 表达 式 值 相同 : 
CL E23 ) C45 ) :3s)4) 


换 句 话说 ,我 们 可 以 把 每 个 运算 符 放 在 两 个 操作 数 之 后 ， 而 不 是 放 在 两 个 操作 数 之 间 。 在 
这 类 表达 式 中 ， 每 一 个 运算 符 后 紧 跟 一 个 右 括号 ， 所 以 忽略 这 些 括号 ， 表 达 式 可 以 表示 如 下 : 


业 这 3 二 


这 种 表示 法 被 称 为 反 向 波兰 表示 法 (reverse Polish notation) 或 后 组 法 (postfix)。 为 了 
计算 后 缀 表达 式 的 值 ， 只 使 用 一 个 栈 即 可 (具体 见 练习 4.3.15 )。 从 左 到 右 ， 一 次 处 理 一 个 


实体 ， 我 们 按照 下 列 两 种 可 能 的 情况 操作 栈 : 
。 将 操作 数 压 人 栈 。 


。 在 遇 到 运算 符 时 ， 弹 出 必要 数量 的 操作 数 ， 并 将 运算 符 和 这 些 操 作 数 完成 计算 后 的 结 


果 压 人 栈 。 


同样 ， 这 个 过 程 最 终 在 栈 上 只 剩 下 一 个 值 ， 即 表达 式 的 值 。 这 种 表示 非常 简单 ， 以 至 于 
某 些 编程 语言 如 Forth (一 种 科学 编程 语言 ) 和 PostScript (大 多 数 打 印 机 上 使 用 的 页 面 描述 


擎 法 和 数据 结 六 ”如 疗 


语言 ) 使 用 显 式 栈 作为 主要 的 程序 控制 流 管理 结构 。 例 如 ， 字 符 串 “12 3+45**+” 是 

Forth 和 PostScript 中 的 合法 程序 ， 会 得 出 值 101 并 保存 在 执行 es 

栈 上 。 在 一 些 基于 栈 的 编程 语言 中 也 采用 类 似 的 实现 方式 , 因 夺 二 23445**+ 

为 它们 对 于 许多 类 型 的 计算 来 说 更 简单 。 实 际 上 ，Java 虚拟 机 EE 3 ,45。，*+ 

本 身 就 是 基于 栈 的 方式 实现 的 。 甘 23 +45**w+ 
函数 调用 抽象 。 大 多 数 程序 隐 式 地 使 用 栈 ， 因 为 栈 是 用 来 EE | 45*，*} 

实现 函数 调用 的 自然 方式 。 在 函数 执行 的 过 程 中 ,我 们 定义 其 G5**+ 

状态 为 所 有 变量 的 值 和 指向 下 一 条 执行 指令 的 指针 。 计 算 环境 区 2 **+ 

的 一 个 基本 特征 是 每 个 计算 完全 由 其 状态 (及 其 输入 的 值 ) 决 。 E52 *+ 

定 。 因此， 系统 可 以 通过 保存 状态 来 临时 中 止 一 个 计算 ,然后 ”区 地 了 + 

通过 恢复 状态 来 恢复 这 个 计算 。 如 果 你 学 习 了 操作 系统 课程 ， [ 哄 一 

将 会 了 解 此 过 程 的 更 多 细节 ， 这 一 技术 是 实现 很 多 常用 功能 的 ”后 绥 表 达 式 值 的 计算 过 程 跟踪 

关键 所 在 (例如 ， 从 一 个 应 用 程序 切换 到 另 一 个 应 用 程序 只 是 一 个 保存 状态 和 恢复 状态 的 问 

题 而 已 )。 使 用 栈 来 实现 函数 调用 的 抽象 是 一 个 很 自然 的 方法 。 要 调用 一 个 函数 ， 将 调用 时 

的 状态 压 入 栈 。 若 要 从 函数 调用 中 返回 ， 则 从 栈 中 弹出 状态 ， 以 便 恢复 函数 调用 之 前 的 所 有 

变量 值 ， 在 包含 函数 调用 的 表达 式 中 (如 果 有 的 话 )， 还 须 将 函数 返回 值 (如果 存 在 的 话 ) 替 

换 人 表达 式 中 ， 然 后 继续 执行 下 一 条 要 执行 的 指令 (其 位 置 是 计算 保存 状态 的 一 部 分 )。 只 要 

发 生 了 函数 调用 ， 这 种 机 制 即 可 递归 地 工作 。 事 实 上 ， 如 果 你 仔细 思考 这 个 过 程 ， 会 发 现 这 

个 过 程 和 我 们 刚才 详细 讨论 的 表达 式 计算 过 程 基本 相同 。 一 个 程序 就 是 一 个 复杂 的 表达 式 。 


public static void sort(a，0，4) 
{ 


















push 
public static void sort(a, 0, 2) public static void sort(a, 0, 4) 
a a { [public static void sortCa, 0, 2) 
if (n <= 3 return; { fpublic static void sort(a, 1, 2) 
sort(a, 0, DD) push { 


int n=2-1; 

if (n <= 1) return; 0 
sort(a, 0, 1); P P 
地 at 2)3 


sort(a, 1, 2); 


{ |public static void sort(a, 0, 1) public static void sort(a, 0, 4) 
{ { [pubTic static void sortCa, 0, 2) 
int n = 了 { 
if (Cn <= 人 
sort(a, 0, 1); 
sort(a, 1, 2); 


int n=2- 0; 
if (n <= a return; 
sort(a, 0, 2); 
oreg 过 ， 4); 


BAT Win pop 


public static void sort(a, 0, 4) 
{ ey static void sort(a, 0, 2) public static void sort(a, 0, 4) 


int n=2 0; int n=4-0; 

if (n <= 5 return; if (n<= co return; 

sort(a, 0, 1); sort(a, 0, 2); 

sor 二 Ds E293 y i 2 4); push 


} 





使 用 栈 实现 函数 调用 


下 推 栈 是 一 个 基本 的 计算 抽象 。 栈 已 成 功 应 用 于 表达 式 计算 、 实 现 函 数 调用 抽象 ， 以 及 
计算 早期 就 存在 的 许多 基本 任务 。 我 们 将 在 4.4 节 讨 论 它 的 另 一 个 重要 应 用 〈 树 遍历 ) 。 栈 在 
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计算 机 科学 的 许多 领域 都 有 显 式 和 广泛 的 应 用 ， 包 括 算法 设计 、 操 作 系 统 、 编 译 器 ， 以 及 许 


多 其 他 的 计算 应 用 。 

FIFO 队列 ”FIFO 队列 (也 被 简称 为 队列 ) 是 一 
个 基于 先进 先 出 策略 的 集合 。 

按照 到 达 先 后 顺序 执行 任务 是 日 常生 活 中 经 常 
使 用 到 的 策略 ， 从 剧院 中 的 排队 人 群 到 收费 站 排队 的 
汽车 ， 到 你 的 计算 机 中 等 待 应 用 程序 处 理 的 任务 ， 都 
在 使 用 “ 先 来 先 服务 ”的 原则 。 

任何 服务 政策 的 一 个 基本 原则 就 是 公平 。 大 多 
数 人 想到 公平 的 时 候 首 先 想 到 的 是 等 候 最 长 时 间 的 人 
应 该 优先 得 到 服务 。 这 正 是 先入 先 出 的 原则 ， 所 以 队 
列 在 许多 应 用 程序 中 占据 十 分 重要 的 地 位 。 队 列 是 许 
多 日 常 现象 的 自然 模型 ， 在 计算 机 问世 之 前 ， 其 特性 
已 经 得 到 深入 的 研究 。 

像 往常 一 样 ， 我 们 从 描述 一 个 API 开始 。 依 据 传 
统 ， 队 列 插 人 操作 命名 为 入 队 (enqueue)， 删 除 操作 命 
名 为 出 队 (dequeue)， 如 以 下 API 所 示 : 


public class Queue<Item> 


QueueQ) 
boolean isEmpty() 
void enqueue(Item item) 


Item dequeue() 


int size() 


客户 队列 
[ei 
新 到 达 的 排 在 队 尾 
入 队 | 
GD) To 
新 到 达 的 排 在 队 尾 
入 队 中 | 
CD) COCOGOICGOCO) 
队列 中 第 一 个 先 出 队 

出 队 


二 T 加 四 四 吕 


队列 中 下 一 个 再 出 队 
出 队 | 
[In [L233)C4) 


一 个 典型 FIFO 队列 


创建 一 个 空 队列 
队列 是 空 的 吗 ? 
将 一 个 项 插入 队列 中 


移 除 并 返回 队列 中 最 早 加 入 的 项 
队列 中 项 的 个 数 


通用 FIFO 队列 的 API 


从 API 可 以 看 到 ， 我们 将 在 实现 中 使 用 泛 型 ， 
这 样 就 可 以 编写 客户 程序 来 安全 地 创建 和 使 用 任何 
引用 类 型 的 队列 。 我 们 还 增加 了 一 个 size() 方法， 
而 栈 并 没有 这 样 的 方法 ， 因 为 队列 客户 程序 通常 需 
要 知道 队列 中 项 的 数量 ， 而 大 多 数 栈 的 客户 程序 并 
不 需要 (参见 程序 4.3.8 和 练习 4.3.11 )。 

根据 从 栈 中 获得 的 知识 ， 我 们 可 以 使 用 链表 或 
可 变数 组 来 开发 队列 的 实现 ， 其 操作 时 间 为 常量 ， 
队列 所 占 的 内 存 大 小 随 着 队列 中 项 的 数量 的 增加 或 
减少 而 变化 。 与 栈 一 样 ， 每 一 个 实现 都 是 一 个 经 典 
的 编程 练习 。 在 进一步 阅读 之 前 ， 你 可 以 想 一 想 如 
何 实现 这 些 代码 。 

链表 实现 。 为 了 用 一 个 链表 实现 一 个 队列 ， 我 
们 将 这 些 项 目 按 其 到 达 先 后 顺序 保存 (与 我 们 在 
Stack 中 使 用 的 顺序 相反 )。dequeue0 的 实现 与 Stack 


保存 一 个 指向 链表 最 后 一 个 节点 的 链接 
Node oldLast = last; 
oldLast 





为 最 后 一 个 节点 创建 一 个 新 的 节点 


Node last = new Node(); 
last.item = "not"; 
oldLast 





将 新 节点 链接 到 链表 的 最 后 一 个 节点 


oldLast.next = last; 





在 链表 的 未 尾 插入 新 节点 
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中 的 pop0 实现 相同 (保存 第 一 个 节点 的 数据 项 ， 从 队列 中 移 除 第 一 个 节点 并 返回 保存 的 
项 )。 然 而 ， 实 现 enqueue() 有 点 复杂 : 如 何 将 一 个 节点 添加 到 链表 的 末尾 ? 为 此 ,我 们 需 
要 一 个 指向 链表 最 后 一 个 节点 的 链接 ， 因 为 原来 指向 最 后 一 个 链接 的 链接 将 用 来 指向 待 插入 
的 新 节点 。 在 Stack 中 ， 唯 一 的 实例 变量 即 指向 链表 第 一 个 节点 的 引用 ; 借助 这 些 信息 想 找 
到 链表 的 末尾 ， 唯 一 的 办 法 就 是 遍历 链表 的 所 有 节点 直到 最 后 。 对 于 长 链表 ， 该 解决 方案 效 
率 低下 。 一 个 合理 的 替代 方案 是 增加 一 个 实例 变量 ， 用 于 指向 链表 的 最 后 一 个 节点 。 额 外 增 
加 一 个 需要 维护 的 实例 变量 是 不 能 掉以轻心 的 -特别 是 在 链表 代码 中 ， 因 为 每 个 修改 链表 的 
方法 都 需要 通过 代码 来 检查 该 变量 是 否 需 要 修改 (并 进行 必要 的 修改 )。 例 如 ， 移 除 链表 的 
第 一 个 节点 可 能 涉及 对 最 后 一 个 节点 引用 的 修改 ， 因 为 如 果 链 表 只 有 一 个 节点 ， 所 以 该 节点 
既是 第 一 个 ， 也 是 最 后 一 个 〈 类 似 的 细节 使 得 链表 代码 难于 调试 )。Queue (程序 4.3.6 ) 是 
FIFO 队列 API 的 链表 实现 ， 它 具有 与 栈 相 同 的 性 能 属性 : 所 有 方法 都 是 常量 时 间 ， 内 存 使 
用 量 与 队列 大 小 成 正比 。 


程序 4.3.6 ”通用 FIFOI 队 列 (链表 ) 
public class Queue<Item> 


private Node first; 1 first 
private Node last; 1ast 


链表 中 第 一 个 节点 





链表 中 最 后 一 个 节点 


private class Node 





队列 项 
链表 中 下 一 个 节点 


Item item; 1 item 
Node next; “next 


} 


public boolean isEmpty() 
{ return (first == nul1); } 





public void enqueue(Item item) 
1/ 在 链表 的 末尾 插入 一 个 新 节点 
Node oldLast = last; 
last = new Node(); 
last.item = item; 
last.next = null; 


rm 


if (isEmpty()) first = last; 
else oldLast.next = last; 
} 
public Item dequeue() 
{ /删除 链表 的 第 一 个 节点 ， 并 返回 它 的 数据 项 
em item = first.item; 
first = first,.next; 
if 〈isEmpty()) last = nu11; 
return item; 
} 
public static void main(String[] args) 


{ /VW 测试 客户 程序 与 程序 4.3.2 类 似 


Queue<String> queue = new Queue<String>(); 


} 


此 实现 非常 类 似 于 栈 的 链表 实现 (程序 4.3.2 ) : dequeue0 与 pop0 几乎 相 
同 ， 只 是 enqueue0 会 将 新 节点 链接 到 链表 的 末尾 ， 而 不 是 如 push 0 插入 开头 。 
为 此 ,程序 维护 一 个 指向 链表 最 后 一 个 节点 的 实例 变量 last。size ( 方法 留 作 
练习 《人 参见 练习 4.3.11 ) 。 


% java Queue < tobe.txt 
to be or not to be 
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Queue 的 测试 客户 程序 的 跟踪 (参见 程序 4.3.6 ) 


数组 实现 。 我 们 其 实 还 可 以 使 用 数组 开发 FIFO 队列 的 实现 方法 ， 就 像 我 们 在 
ArrayStackOfStrings (程序 4.3.1 ) 和 ResizingArrayStackOfStrings (程序 4.3.3 ) 中 实现 的 不 
同 的 栈 一 样 ， 它 们 有 着 相同 的 性 能 特征 。 这 些 实现 可 以 留 作 编 程 练习 ， 值 得 你 进一步 研究 
(参见 习题 4.3.19 )。 

随机 队列 。 尽 管 FIFO 和 LIFO 应 用 广泛 ,但 它们 的 原理 却 并 不 神秘 。 考 虑 删除 数据 项 时 
使 用 其 他 规则 也 是 非常 有 意义 的 。 考 虑 这 样 一 种 数据 类 型 ， 方 法 dequeue() 移 除 并 返回 一 个 随 
机 项 (不 重 置 抽样 )， 方 法 sample() 返回 一 个 随机 项 而 不 从 队列 中 移 除 它 〈 重 置 抽样 )。 我 们 使 
用 名 称 RandomQueue 来 表示 此 数据 类 型 (请 参见 练习 4.3.37 )， 这 也 是 一 种 重要 的 数据 结构 。 

栈 、 队 列 和 随机 队列 的 API 本 质 上 是 相同 的 一 一 它们 仅 在 类 和 方法 名 称 的 选择 上 有 所 
不 同 。 这 些 数据 类 型 之 间 的 真正 区 别 在 于 删除 操作 的 语义 一 一 哪个 项 目 将 被 删除 ? 栈 和 队列 


党 法 禾 据 结构 
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之 间 的 区 别 从 它们 的 名 字 和 自然 语言 描述 当中 就 能 找到 。 这 些 区 别 类 似 于 Math.sin (x) 和 
Math.log (x) 之 间 的 差异 ,但 是 我 们 也 许 希 望 使 用 栈 和 队列 的 形式 化 描述 来 曾 明 其 含义 (就 
像 使 用 正弦 和 对 数 函 数 的 数学 描述 一 样 的 方法 )。 但 是 ， 精 确 地 描述 先入 先 出 、 后 进 先 出 或 
者 随机 移 除 并 不 是 那么 简单 。 对 于 初学 者 ， 你 将 使 用 哪 种 语言 进行 描述 ? 英语 ? Java 或 数 
学 逻辑 ? 描述 程序 如 何 运 行 的 问题 被 称 为 规范 化 问题 ( specification problem)， 它 直接 引发 
了 计算 机 科学 中 的 深层 问题 。 我 们 强调 清晰 和 简洁 代码 的 重要 性 的 一 个 原因 是 ， 代 码 本 身 可 


以 用 作 简 单数 据 类 型 (如 栈 、 队 列 和 随机 队列 ) 的 规范 。 


队列 的 应 用 ”在 过 去 的 一 个 世纪 ，FIFO 队列 被 证 明 是 在 各 种 各 样 的 应 用 中 准确 和 有 效 
的 模型 ， 从 制造 过 程 到 电话 网 络 到 交通 模拟 ， 并 且 由 此 产生 了 一 个 被 称 为 排队 论 的 数学 领 


时 间 ( 秒 ) 


域 ， 它 成 功 地 用 于 理解 和 控制 各 种 复杂 的 系统 。FIFO 队列 在 计算 
中 同样 起 着 重要 的 作用 。 使 用 计算 机 时 经 常 遇 到 队列 : 播放 列表 
中 的 歌曲 、 要 打印 的 文档 或 游戏 中 的 事件 。 

也 许 队 列 最 大 、 最 重要 的 应 用 是 互联 网 本 身 。 互 联网 就 是 由 
大 量 复 杂 的 队列 构成 的 ， 这 些 队 列 具 有 各 种 不 同 的 属性 ， 并 且 使 
用 各 种 复杂 的 方式 相互 连接 ,在 这 些 队列 中 有 大 量 的 消息 在 移动 
和 传递 。 理 解 和 控制 这 样 一 个 复杂 的 系统 涉及 队列 抽象 的 实现 、 
排队 论 的 应 用 ， 以 及 涉及 两 者 的 模拟 研究 。 接 下 来 我 们 讨论 一 个 
经 典 的 例子 来 说 明 这 个 过 程 。 

M/M/1 队列 。M/M/1 队列 是 最 重要 的 队列 模型 之 一 ， 它 被 证 
明 可 以 精确 模拟 许多 现实 世界 的 情况 ， 比 如 进入 收费 站 的 一 列 汽 
车 或 进入 急诊 室 的 患者 。M 表示 马尔 可 夫 的 (Markovian) 或 无 记 
忆 的 ， 表示 到 达 和 服务 都 是 泊 松 过 程 ， 到达 间隔 时 间 和 服务 时 间 
都 服从 指数 分 布 (具体 见 练习 2.2.8 ) ; 1 表示 有 一 台 服 务 器 。M/ 
M/1 队列 的 参数 由 其 到 达 率 4 (例如 ， 每 分 钟 到 达 收 费 站 的 车 辆 数 ) 
及 其 服务 率 1( 例 如 ， 每 分 钟 可 以 通过 收费 站 的 汽车 数量 ) 组 成 ， 
其 具有 以 下 三 个 属性 : 

。 只 有 一 个 服务 器 一 一 一 个 FIFO 队列 。 

。 队列 的 到 达 时 间 间 隔 服 从 指数 分 布 ， 速 率 为 4/ 分钟。 

。 非 空 队列 的 服务 时 间 服 从 指数 分 布 ， 速 率 为 w/ 分 钟 。 

到 达 的 平均 时 间 间 隔 是 1 分钟， 平均 服务 时 间 ( 当 队列 是 非 
空 时 ) 是 1/ 分钟。 因此 ， 如 果 无 法 满足 1>4 则 队列 将 无 限制 地 增 
长 。 不然 ， 顾客 在 一 个 有 趣 的 动态 过 程 中 进入 并 离开 队列 。 

分 析 。 在 实际 应 用 中 ， 人 们 对 参数 1 和 人 对 队列 不 同属 性 的 
影响 很 感 兴趣 。 如 果 你 是 一 名 顾客 ， 你 可 能 想 知 道 在 系统 中 预期 花 
费 的 时 间 。 如 果 你 正在 设计 这 个 队列 系统 ， 你 可 能 想 知 道 有 多 少 顾 
客 在 系统 中 ， 或 者 更 复杂 一 些 ， 比 如 队列 大 小 超过 给 定 最 大 容量 的 
可 能 性 为 多 少 。 对 于 简单 的 模型 ， 由 概率 论 推 导出 的 公式 可 以 使 用 
4 和 4 的 函数 来 定量 表示 这 些 信息 。 对 于 M/M/1 队列 ， 已 知 : 

。 系统 中 的 平均 客户 数 L=N/(1-4)。 

。 一 名 顾客 在 系统 中 花费 的 平均 时 间 所 1/(1-)。 


ibe Fe 


TO 上 


一 个 M/M/1 队列 


348 ”项 4 人间 


例如 ， 如 果 汽 车 以 本 10 辆 /分 钟 的 速度 到 达 ， 并 且 服 务 速率 是 /=15 辆 /分 钟 ， 则 系统 
中 汽车 的 平均 数量 将 是 2， 并 且 顾 客 在 系统 中 花费 的 平均 时 间 将 是 1/5 分 钟 或 12 秒 。 这 些 公 
式 证 明 ， 当 4 趋 近 于 4 时 ， 等待 时 间 (和 队列 长 度 ) 将 会 无 限制 地 增长 。 它 们 也 服从 一 个 被 
称 为 利 特 尔 定律 的 基本 规则 : 系统 中 顾客 的 平均 数量 等 于 顾客 在 系统 中 花费 的 平均 时 间 的 4 
倍 (L=4W)。 

模拟 。MMI1Queue (程序 4.3.7) 是 一 个 Queue 的 客户 程序 ， 可 以 用 于 来 验证 这 些 数 学 
结果 。 这 是 一 个 基于 事件 的 模拟 ( event-based simulation) 方法 的 简单 例子 : 我 们 生成 在 特 
定时 间 发 生 的 事件 ， 并 根据 事件 相应 地 调整 我 们 的 数据 结构 ， 模 拟 事件 发 生 时 间 点 的 状况 。 
在 M/M/1 队列 中 ， 存 在 两 种 类 型 的 事件 : 客户 到 达 事 件 和 客户 服务 事件 。 与 之 相对 应 ， 我 
们 维护 以 下 两 个 变量 : 

。 nextService 是 下 一 个 服务 的 时 间 。 

。 nextArrival 是 下 一 次 到 达 的 时 间 。 


程序 4.3.7 一 MUMVI 队 列 模拟 


or ic class MMiQueue 到 达 率 
public static void main(CString[] args) 


double lambda = Double.parseDouble(args[0]); 

double mu = Double.parseDouble(args[1]); 队列 时 间 
Histogram hist = new Histogram(60 + 1); 

Queue<Double> queue = new Queue<Double>(); 

double nextArrival = StdRandom.exp(Clambda) ; 

double nextService = nextArrival + StdRandom.exp(mu); 
StdDraw.enableDoubleBuffering(); 


while (true) 
{ /1/ 模拟 服务 之 前 到 来 的 顾客 


while (nextArrival < nextService) 


queue.enqueue (nextArrival); 
nextArrival += StdRandom.exp(Clambda) ; 


} 
/ 模拟 服务 过 程 
double wait = nextService - queue.dequeue(); 
hist.addDataPoint(Math.min(60, (int) Math.round(wait))); 
StdDraw.clearQO; 
hist.draw() ; 
StdDraw.showO; 
StdDraw.wait(20); 
if (queue.isEmpty()) 
nextService = nextArrival + StdRandom.exp(mu); 
else 
nextService = nextService + StdRandom.exp(mu); 


M/M/1 队 列 的 这 个 模拟 通过 两 个 变量 nextArrival 和 nextService 以 及 一 个 double 
值 队 列 来 计算 等 待 时 间 。 队 列 中 每 个 项 的 值 是 进入 队列 的 时 间 ( 模拟 时 间 ) 。 
等 待 时 间 使 用 Histogram (程序 3.2.3 ) 进行 绘制 。 





为 了 模拟 到 达 事 件 ， 我 们 将 nextArrival (到 达 时 间 ) 加 入 队列 ; 为 了 模拟 一 个 服务 ， 将 
队列 中 的 客户 移出 ， 并 根据 它 的 到 达 时 间 计 算 客 户 的 等 待 时 间 wait ( 即 服务 完成 时 间 减 去 
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客户 进入 队列 的 时 间 )， 并 将 等 待 时 间 加 入 直方 图 中 (请 参阅 程序 3.2.3 )。 经 过 大 量 的 试验 ， 
产生 的 形状 是 M/M/1 排队 系统 的 特征 。 从 实际 的 角度 来 看 ， 通 过 运行 MM1Queue 可 以 发 现 
该 过 程 的 最 重要 特征 之 一 是 ， 对 于 不 同 的 参数 值 4 和 人 ， 当 服务 率 趋 近 于 到 达 率 时 ， 一 名 顾 
客 在 系统 中 花费 的 平均 时 间 (以 及 系统 中 平均 顾客 数量 ) 显著 增加 。 当 服务 率 很 高 时 ， 直 方 
图 会 出 现 一 个 细 长 的 尾部 ， 表 示 随 着 等 待 时 间 增 加 ， 给 定 客户 需要 等 待 时 间 的 相应 概率 很 快 
减少 到 可 忽略 。 但 当 服 务 率 趋 于 到 达 率 时 ， 直 方 图 延伸 到 大 部 分 值 都 在 尾部 ， 所 以 长 等 待 时 
间 顾 客 的 频率 古 主导 地 位 。 
服务 率 明显 


高 于 到 达 率 
java MMlQueue 0.167 0. 254 


人 发 时 间 等 竺 的 
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MM1Queue 的 示例 运行 


与 我 们 研究 过 的 许多 其 他 应 用 程序 一 样 ， 使 用 模拟 来 验证 一 个 很 好 理解 的 数学 模型 是 研 
究 更 复杂 情况 的 起 点 。 在 实际 队列 应 用 程序 中 ， 我 们 可 能 有 多 个 队列 、 多 个 服务 器 、 多 级 服 
务 器 、 队 列 长 度 等 诸多 限制 。 此 外 ， 到 达 时 间 间 隔 和 服务 时 间 的 分 布 可 能 无 法 用 数学 方法 描 
述 。 在 这 种 情况 下 ， 除 了 使 用 模拟 外 我 们 别 无 选择 。 系 统 设计 者 通常 建立 一 个 队列 系统 的 计 
算 模型 (如 MM1Queue)， 并 使 用 这 个 计算 模型 来 调整 设计 参数 (如 服务 率 )， 以 正确 响应 外 
部 环境 (如 到 达 时 间 )。 

可 和 迭代 的 集合 ”正如 本 节 前 面 提 到 过 的 ， 数 组 和 链表 上 用 来 处 理 每 个 元 素 的 一 个 基本 操 
作 是 for 循环 语句 。 这 是 一 种 常见 的 程序 设计 范式 ， 并 不 局 限于 低层 次 的 数据 结构 ， 如 数组 
和 链表 。 对 于 任何 集合 来 说 ， 处 理 其 所 有 项 的 能 力 ( 可 以 是 以 某 种 特定 的 顺序 ) 是 一 种 非常 
重要 的 功能 。 客 户 程序 的 要 求 只 是 以 某 种 方式 处 理 每 个 项 目 ， 或 者 迭代 集合 中 的 项 目 。 这 个 
范式 非常 重要 ， 以 至 于 在 Java 和 许多 其 他 现代 程序 设计 语言 中 都 被 当 作 最 重要 的 使 用 模式 
来 提供 支持 (这 意味 着 语言 本 身 具 有 支持 它 的 特定 机 制 ， 而 不 仅仅 是 通过 库 来 支持 )。 有 了 
它 ， 我 们 可 以 编写 清晰 而 紧凑 的 代码 ， 而 无 须 依 赖 集合 实现 的 细节 。 

为 了 引入 这 个 概念 ， 我 们 从 一 个 客户 程序 代码 的 片段 开始 研究 ， 以 下 代码 用 于 打印 一 个 
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字符 串 集 合 中 的 所 有 项 (每 行 一 个 ): 
Stack<String> collection = new Stack<String>(); 


for (String s : collection) 
StdOut.print1ln(s); 


这 个 结构 被 称 为 foreach 语句 : 你 可 以 这 样 理解 它 : 对 于 集合 collection 中 的 每 个 字符 
串 s， 打 印 它 的 内 容 。 这 个 客户 程序 代码 不 需要 知道 任何 有 关 和 集合 的 表示 或 实现 的 细节 ; 只 
是 处 理 集合 中 的 每 一 项 。 相 同 的 foreach 循环 可 以 用 于 处 理 字符 串 队列 或 任何 其 他 可 迭代 的 
字符 串 集合 。 

我 们 很 难 想象 代码 可 以 如 此 清晰 而 紧凑 。 但 是 ， 以 这 种 方式 实现 支持 迭代 的 集合 需要 一 
些 额外 的 工作 ， 我 们 现在 详细 讨论 。 首 先 ，foreach 结构 其 实 是 一 个 while 结构 的 简写 。 例 
如 ， 前 面 给 出 的 foreach 语句 等 同 于 下 述 结构 : 


Iterator<String> iterator = collection.iterator(); 
while (iterator.hasNext()) 


String s = iterator.next(); 
Stdout.println(s) ; 
} 
这 段 代 码 表明 了 在 任何 可 迭代 集合 中 我 们 需要 实现 的 三 个 必要 的 部 分 : 
。 集合 必须 实现 一 个 返回 Iterator 对 象 的 iterator() 方法 。 
。 Iterator 类 必须 包含 两 个 方法 : hasNext0 (返回 布尔 值 ) 和 next0 (从 集合 中 返回 一 个 项 目 )。 
在 Java 中 ,我 们 使 用 接口 继承 机 制 来 表达 一 个 类 实现 一 组 特定 方法 的 设计 思路 (参见 
3.3 节 )。 对 于 可 迭代 集合 ， 这 些 必要 的 接口 是 在 Java 语言 的 规范 中 预定 义 的 。 
为 了 使 一 个 类 可 迭代 ， 第 一 步 是 在 其 声明 中 添加 这 一 句 : implements Iterable<Item>: 


public interface Iterable<Item> 


{ 


Iterator<Item> iterator() ; 


按照 以 上 接口 (接口 的 定义 在 Java.lang.Iterable 中 )， 实 现 一 个 返回 Iterator<Item> 的 方法 并 
将 代码 添加 到 类 中 。Iterator 是 个 泛 型 ， 因 此 客户 程序 可 以 通过 它 来 实现 对 任何 指定 类 型 对 
象 的 迭代 访问 (当然 也 仅 能 访问 指定 类 型 的 对 象 )。 

那么 ,什么 是 迭代 器 ? 迭代 器 是 实现 了 hasNext() 和 next( 方法 等 接口 的 类 的 对 象 ， 接 
口 的 定义 如 下 (在 Java.util.Iterator 中 定义 ): 


public interface Iterator<Item> 
{ 

boolean hasNext() ; 

Item next(); 

void remove(); 


} 


尽管 接口 需要 remove() 方法 ,但 是 我 们 在 本 书 中 总 是 使 用 一 个 空 方 法 来 实现 remove()， 
因为 最 好 避免 将 迭代 与 修改 数据 的 操作 交织 在 一 起 。 

在 下 面 的 两 个 例子 中 我 们 将 展示 ， 对 于 和 集合 的 数组 和 链表 表示 ， 实 现 一 个 迭代 器 类 通常 
是 很 容易 的 。 
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使 一 个 使 用 数组 的 类 变 得 可 迭代。 对 于 第 一 个 例子 ， 我 们 将 考虑 如 何 使 ArrayStackOfStrings 
(程序 4.3.1 ) 变 得 可 和 迭代。 首先 ， 将 类 声明 更 改 为 


public class ArrayStackOfStrings implements Iterable<String> 


换 名 话说， 我 们 提供 一 个 iterator() 方法 ， 以 便 客户 程序 可 以 使 用 foreach 语句 遍历 栈 中 
的 字符 串 。Iterator() 方法 本 身 很 简单 : 


public Iterator<String> iterator(O) 

{ return new ReverseArrayIterator(); } 

上 述 代 码 只 是 从 一 个 实现 了 Iterator 接口 的 私有 岗 套 类 (提供 了 hasNext()、next() 和 
remove() 方法 ) 返回 一 个 对 象 : 


private class ReverseArrayIterator implements Iterator<String> 
{ 


private int i = n-l1; 
public boolean hasNext() 
{return 1 >= 0;™} 
public String next() 
{ return items[i--]; } 
public void remove() 


:3 
} 


请 注意 ， 栎 套 类 ReverseArraylterator 可 以 访问 类 内 部 的 实例 变量 (这 种 能 力 是 我 
们 为 迭代 器 使 用 从 套 类 的 主要 原因 )， 在 本 例 中 为 items[] 和 n。 一 个 关键 的 细节 是 : 在 
ArrayStackOfStrings 代码 的 开始 处 必须 添加 


import java.util.Iterator; 


现在 ， 由 于 客户 程序 可 以 将 foreach 语句 与 ArrayStackOfStrings 对 象 一 起 使 用 ， 因 此 可 
以 在 不 知道 底层 数组 表示 的 情况 下 遍历 项 。 这 种 安排 对 于 集合 的 基本 数据 类 型 的 实现 至 关 
重要 。 例 如 ， 它 使 得 我 们 可 以 切换 到 完全 不 同 的 数据 实现 方式 ， 而 无 须 更 改 任何 客户 程序 代 
码 。 更 重要 的 是 ， 从 客户 程序 的 角度 来 看 ， 它 使 得 客户 程序 可 以 直接 使 用 和 迭代， 而 无 须 了 解 
实现 的 任何 细节 。 

使 一 个 使 用 链表 的 类 变 得 可 迭代 。 使 用 基本 相同 的 步骤 (当然 是 不 同 的 代码 ) 可 以 有 效 地 
使 Queue (程序 4.3.6 ) 可 迭代 ，Queue 中 原来 使 用 的 泛 型 不 受 影响 。 首 先 ， 将 类 声明 更 改 为 


public class Queue<Item> implements Iterable<Item> 


换 句 话说 ， 我 们 提供 了 一 个 iterator0) 方法 ， 以 便 客户 程序 可 以 使 用 foreach 语句 遍历 队 
列 中 的 项 目 ， 而 无 论 它 们 是 什么 类 型 。iterator() 方法 本 身 很 简单 : 


public Iterator<Item> iterator() 
{ return new ListIterator(); } 


同 以 前 一 样 ， 我 们 有 一 个 实现 Iterator 接口 的 私有 艇 套 类 : 
private class ListIterator implements Iterator<Item> 


Node current = first; 


public boolean hasNext() 
{ return current != null; } 
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public Item next() 


Item item = current.item; 
current = current,.next; 
return item; 


public void removeO) 
二 
} 


同样 ， 客 户 程 序 可 以 构建 由 任何 类 型 的 数据 项 构成 的 队列 ， 然 后 遍历 这 些 项 ， 而 无 须知 
道 底 层 链 表 的 表示 形式 : 


Queue<String> queue = new Queue<String>() ; 


pa (String s : queue) 
Stdout.print1ln(s) ; 

此 客户 程序 代码 更 加 清晰 ， 因 此 比 基 于 低级 表示 的 代码 更 容易 编写 和 维护 。 

我 们 的 栈 和 迭代 器 以 LIFO 顺序 遍历 这 些 项 ， 队 列 和 迭代 器 以 FIFO 顺序 对 项 进行 遍历 ， 即 
使 并 没有 这 些 要 求 : 我 们 可 以 以 任何 顺序 返回 数据 项 。 但 在 开发 迭代 器 时 ， 一 个 明智 的 做 法 
是 遵循 这 样 一 个 简单 的 规则 如果 数据 类 型 规范 中 希望 使 用 某 种 迭代 顺序 ， 那 么 请 使 用 它 。 

可 迭代 的 实现 可 能 对 你 来 说 有 点 复杂 ， 但 这 是 值得 努力 探究 的 。 我 们 不 会 经 常 自己 去 实 
现 它 们 ， 但 是 这 样 做 ， 我 们 会 享受 到 清晰 和 正确 的 客户 程序 代码 以 及 代码 复 用 带 来 的 好 处 。 
此 外 ;正如 任何 一 种 学 过 的 程序 设计 结构 一 样 ， 一 且 我 们 能 够 熟练 运用 这 些 结 构 ， 你 会 发 现 
自己 经 常 使 用 它们 并 从 中 获 益 。 

使 一 个 类 变 得 可 迭代 肯定 会 改变 其 API， 但 为 了 避免 过 于 复杂 的 API 表 ， 我们 只 使 用 形 
容 词 iterable 来 表示 我 们 已 将 相应 的 代码 包含 到 类 中 〈 如 本 节 所 述 )， 并 且 客 户 代码 可 以 直接 
使 用 foreach 语句 。 从 这 里 开始 ， 我 们 将 在 客户 程序 中 直接 使 用 此 处 描述 的 可 迭代 (并 支持 
泛 型 ) 的 Stack、Queue 和 RandomQueue 数据 类 型 。 

资源 分 配 接 下 来 ,我们 考虑 一 个 应 用 程序 ， 演 示 我 们 已 经 讨论 过 的 数据 结构 和 Java 
语言 功能 。 一 个 资源 共享 系统 涉及 大 量 松 耦 合 、 协 作 的 服务 器 ， 这 些 服务 器 都 同意 维护 自 
己 的 共享 资源 项 的 队列 ， 一 个 中 央 管 理 机 构 将 项 目 分 发 给 服务 器 (并 通知 用 户 分 配 的 具体 位 
置 )。 例 如 ,项 目 可 能 是 被 大 量 用 户 共 享 的 歌曲 、 照 片 或 视频 。 为 强调 共享 的 观念 ， 我 们 假 
设 系统 中 包括 数 百 万 个 项 目 和 数 千 个 用 户 。 

在 这 样 的 一 个 系统 中 ， 我 们 来 考虑 中 央 管 理 程序 的 设计 ， 这 个 程序 需要 负责 分 配 项 目 ， 
但 是 忽略 从 系统 中 动态 删除 项 、 添 加 和 删除 服务 器 等 可 能 的 细节 变动 。 

如 果 我 们 使 用 一 种 轮 询 调 度 策略 ;遍历 服务 器 以 逐个 分 配 任务 ， 就 可 以 得 到 一 个 均衡 的 
分 配 ， 但 是 这 需要 一 个 分 配 者 完全 控制 所 有 的 服务 器 ， 在 系统 中 很 难 出 现 这 种 情况 。 例 如 ， 
可 能 存在 大 量 独立 的 分 配 者 ， 所 以 没有 任何 一 个 分 配 者 可 以 拥有 所 有 服务 器 的 最 新 信息 。 因 
此 ， 这些 系统 常常 使 用 随机 策略 ， 其 资源 分 配 基于 随机 选择 。 一 种 更 好 的 策略 是 选择 若干 随 
机 服务 器 当 作 一 次 采样 ， 然 后 把 一 个 新 的 项 目 分 配给 这 次 采样 中 项 目 数 最 少 的 服务 器 。 对 于 
小 型 分 布 式 系统 来 说 ， 这 些 策略 之 间 的 差异 无 关 紧 要 ， 但 对 于 拥有 数 千 个 服务 器 和 数 百 万 个 
项 目的 系统 ， 其 差异 可 能 十 分 巨大 ， 因 为 每 个 服务 器 都 有 固定 数量 的 资源 来 专用 于 这 个 过 
程 。 事 实 上 ， 互 联网 中 确实 存在 类 似 的 系统 ， 其 中 一 些 队列 会 在 特殊 用 途 的 硬件 上 实现 ， 所 
以 队列 长 度 直 接 转 换 为 额外 的 设备 成 本 。 但 是 一 次 采样 应 该 抽取 多 大 的 样本 比较 合适 呢 ? 
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fimport java.util.Iterator; | -一 迭代 器 不 在 编程 语言 中 





public class Queue<Item> 


implements Iterable<Item> 








承诺 实现 iterator() 













private Node first; 
private Node last; 
private class Node 先进 先 出 队列 代码 


Item item; 
Node next; 


全 斑 lTterable 榜 
public void enqueue(Item item) 实现 Iterable 接 口 





pub1ie Item dequeue() 


使 类 可 迭代 所 
public Iterator<Item> iterator() | 





{ return new ListIterator(); } 





private class ListIterator 


implements Iterator<Item> 
{ 9 
Node current = first; 承诺 实现 hasNext(、 

















public boolean hasNextO) nextO 和 remove() 

{ return current != null; } 

public Item nextO 

{ 
Item item = current.item; Ey ; 
current = current.next; 一 实现 Iterator 接 口 
return item; 

- 

public void remove() 

相手 








} 
public static void main(String[] args) 
{ 


Queue<Integer> queue = new Queue<Integer>(); 
while (!StdIn.isEmpty()) 


queue .enqueue(StdIn.readInt()); 
for (int s : queue) ;五 
Stdout.println(s); foreach 语 句 


解析 一 个 迭代 类 


LoadBalance (程序 4.3.8 ) 是 一 个 采样 策略 的 模拟 ， 可 以 用 于 研究 这 个 问题 。 程 序 充 分 
利用 了 数据 结构 (队列 和 随机 队列 ) 和 高 级 结构 ( 泛 型 和 和 迭代 器 ) 这 些 我 们 已 经 仔细 分 析 过 
的 数据 结构 ， 因 此 实验 程序 并 不 难 理解 。 模 拟 程序 维护 了 一 个 随机 队列 ， 并 在 内 循环 中 完成 
计算 ， 使 用 RandomQueue 的 sample() 方法 (练习 4.3.36 ) 随机 抽样 队列 ， 并 将 新 的 服务 请 
求 分 配 到 最 短 的 队列 中 。 令 人 惊讶 的 是 ， 实 验 结果 表明 ， 大 小 为 2 的 采样 会 得 到 近乎 完美 的 
平衡 ， 所 以 扩大 采样 没有 意义 。 

我 们 详细 讨论 了 有 关 栈 和 队列 API 的 基本 实现 ， 特 别 是 分 析 了 不 同 实现 所 需要 的 空间 
和 时 间 。 我 们 这 么 做 不 仅 是 因为 这 些 数 据 类 型 十 分 重要 和 有 用 ， 而 且 还 因为 你 在 自己 定义 数 
据 类 型 和 实现 过 程 中 极 有 可 能 遇 到 相同 的 问题 。 

在 开发 一 个 用 于 维护 数据 集合 的 客户 程序 时 ， 我 们 应 该 使 用 下 推 栈 、FIFO 队列 还 是 随 
机 队列 ? 这 个 问题 的 答案 取决 于 对 客户 需求 的 高 层次 分 析 ， 以 确定 LIFO、FIFO 或 随机 队列 
哪 一 种 规则 更 合适 。 
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程序 4.3.8 “负载 均衡 模拟 





public class LoadBalance 


public static void EE no args) 
{ WW 将 n 项 分 配 到 m 个 服务 器 上 ， 优 先 分 配给 
一 次 采样 中 队列 最 短 的 服务 器 m “| 服务 器 数目 


int m = Integer . parseInt(args[0]); n 项 目 数 
int n = Integer.parseInt(args[1]); sizey | 采样 大 小 
int size = Integer.parseInt(args[2]); 2 

让 人 玲 再 servers | 队列 
// 创建 服务 器 队列 in | 采样 中 最 条 队列 
RandomQueue<Queue<Integer>> servers; A sr 
servers = new RandomQueue<Queue<Integer>>(); ”9ueue | 当前 服务 器 


for (Cint i = 0; i < m;. i++) 
servers.enqueue(new Queue<Integer>(O); 
for (Cint j = 0; j < n; j++) 
汪 // 将 一 个 任务 项 分 配 到 一 个 服务 器 计 
Queue<Integer> min = OS sample(); 
for (int k = 1; k < size; k++) 
{ pt 休 如 果 它 是 最 小 的 ， 那 么 就 更 新 min 
Queue<Integer> queue = servers.sample(); 
if (queue.size() < min.size()) min = queue; 
} V min 中 保存 的 服务 器 队列 最 短 
min.enqueue(j); 
. 
int 1 s 0; 
double[] lengths = new double[m]; 
for (Queue<Integer> queue : servers) 
lengths[i++] = queue.size(); 
StdDraw.setYscale(0, 2.0*n/m); 
StdStats.plotBars(lengths); 
. 
} 


这 个 程序 使 用 了 Queue 和 RandomQueue 的 泛 型 ,模拟 了 将 n 项 目 分 配给 由 m 
个 服务 器 组 成 的 服务 器 集合 的 过 程 。 请 求 被 放 入 随机 选择 的 一 批 服务 器 中 队列 最 
短 的 服务 器 上 . 








% java LoadBalance 50 500 1 | % java LoadBalance 50 500 2 


WT 


我 们 应 该 使 用 数组 、 链 表 还 是 可 变数 组 组 织 数 据 呢 ?这 个 问题 的 答案 依赖 于 对 性 能 需 
求 的 分 析 ， 这 通常 是 低层 次 的 分 析 。 数 组 的 优点 是 可 以 在 常量 时 间 内 访问 任何 项 目 ， 但 缺点 
是 需要 事先 知道 其 最 大 长 度 。 链 表 的 优点 是 可 以 容纳 的 项 目 数量 没有 限制 ,缺点 是 不 能 在 
常量 时 间 内 访问 所 需 的 元 素 。 可 变数 组 结合 了 数组 和 链表 的 优点 (可 以 在 常量 时 间 内 访问 任 
何 元 素 ， 且 无 须 事先 知道 最 大 长 度 ), 但 可 变数 组 有 一 个 (轻微 的 ) 缺点 ， 就 是 运行 时 间 只 
能 在 挫 销 的 基础 上 才能 算 作 常 量 (对 于 某 一 次 单独 的 数据 项 访问 ， 无 法 确定 所 需 的 时 间 一 一 
译 者 注 )。 每 种 数据 结构 都 只 能 适用 于 特定 的 场景 ; 在 很 多 编程 环境 中 ， 你 都 会 看 到 对 这 三 
种 数据 结构 的 应 用 。 例 如 ，Java 类 Java.util.ArrayList 中 使 用 了 可 变数 组 ，Java 类 Java.util. 
LinkedList 中 使 用 了 链表 。 

本 节 中 我 们 讨论 过 的 强大 的 高 级 构造 和 新 的 语言 特性 ( 泛 型 和 迭代 器 ) 并 不 是 一 开始 
就 有 的 。 它 们 是 复杂 的 编程 语言 特性 ， 直 到 21 世纪 初 才 被 广泛 使 用 ， 但 仍然 只 是 主要 由 
专业 程序 员 使 用 。 尽 管 如 此 ， 这 些 新 特性 的 使 用 正在 飞速 发 展 ， 一 方面 ,传统 的 Java 和 


C++ 都 提供 了 完善 的 支持 ， 而 像 Python 和 Ruby 这 样 的 新 语言 也 支持 这 些 高 级 构造 和 语 
言 特性 ; 另 一 方面 ， 掌 握 了 这 些 新 的 特性 确实 可 以 提高 编程 的 效率 和 质量 。 现 在 ， 我 们 已 
经 知道 了 ， 学 习 使 用 一 个 新 的 语言 特性 并 没有 比 学 习 骑 自行 车 或 学 习 编 写 HelloWorld 程 
序 困难 多 少 : 一 开始 看 起 来 非常 神秘 ， 直 到 你 完成 了 第 一 次 尝试 后 发 现 没什么 难 的 ， 然 后 
很 快 它 会 成 为 你 的 第 二 本 能 。 学 会 如 何 使 用 泛 型 和 迭代 器 是 一 件 非常 值得 我 们 花 时 间 完 成 
的 事情 。 


问答 环节 
问 : 我 应 该 在 什么 时 候 通过 new 创建 Node 对 象 ? 


答 : 与 任何 其 他 类 一 样 ， 当 我 们 想 要 创建 一 个 新 的 Node 对 象 (链表 中 的 新 节点 ) 时 才 
应 该 使 用 new。 我 们 不 应 该 使 用 new 来 创建 一 个 对 现 有 Node 对 象 的 引用 。 例 如 ， 代 码 


Node oldFirst = new Node() ; 
oldFirst = first; 


创建 一 个 新 的 节点 对 象 ， 然 后 指向 它 的 唯一 引用 又 立即 丢失 了 。 上 述 代 码 不 会 产生 错误 ,但 
毫 无 理由 地 创建 孤立 项 是 不 规范 的 做 法 。 

问 : 为 什么 要 将 Node 声明 为 骨 套 类 ? 为 什么 是 私有 的 ? 

答 : 把 柑 套 类 Node 声明 为 私有 的 ， 那 么 类 中 的 方法 可 以 引用 Node 对 象 ， 但 是 在 其 他 
类 中 无 法 访问 。 说 明 : 非 静 态 的 舱 套 类 被 称 为 内 部 类 ， 所 以 技术 上 说 Node 类 是 内 部 类 ， 尽 
管 非 泛 型 的 Node 类 可 以 被 声明 是 静态 的 。 

问 : 当 键 入 Javac LinkedStackOfStrings.java 来 运行 程序 4.3.2 和 类 似 的 程序 时 ， 除 了 
LinkedStackOfStrings.class 之 外 ， 还 能 找到 一 个 文件 LinkedStackOfStrings $ Node.class。 这 
个 文件 的 作用 是 什么 ? 

答 : 这 是 骨 套 类 Node 生成 的 文件 。Java 的 命名 约定 是 使 用 $ 符号 将 外 部 类 的 名 称 与 符 
套 类 分 开 。 

问 ; 是 否 允 许 客户 程序 将 null 项 目 插 人 栈 或 队列 ? 

答 : 在 Java 中 实现 集合 数据 结构 时 这 个 问题 经 常 出 现 。 在 我 们 的 实现 (以 及 Java 库 的 
栈 和 队列 ) 中 ， 人 允许 插入 null。 

问 : 是 否 有 栈 和 队列 的 Java 库 ? 

答 : 是 也 不 是 。Java 有 一 个 名 为 Java.util.Stack 的 内 置 库 ， 但 是 当 你 需要 一 个 栈 时 ， 你 
应 该 尽量 不 要 使 用 它 。 这 个 库 有 几 个 额外 的 操作 ， 与 常用 的 栈 的 功能 并 不 完全 相符 。 例 如 ， 
它 可 以 获取 第 ;个 项 目 ， 也 允许 添加 一 个 项 目 到 栈 的 底部 (而 不 是 顶部 )， 所 以 它 可 以 实现 队 
列 的 功能 ! 虽然 有 这 样 的 额外 操作 似乎 是 一 个 惊喜 ， 但 实际 上 也 是 一 个 诅咒 。 我 们 使 用 数据 
类 型 不 是 因为 它们 提供 了 所 有 可 用 的 操作 ， 而 是 因为 它们 仅仅 允许 了 指定 所 需 的 操作 。 这 样 
做 的 主要 好 处 是 系统 可 以 阻止 我 们 执行 实际 上 不 必要 的 操作 。Java.util.Stack 的 API 是 一 个 
过 于 宽泛 的 接口 ， 我 们 通常 应 该 尽量 避免 。 

问 : 我 希望 对 泛 型 栈 使 用 数组 表示 形式 ， 但 像 下 面 这 样 的 代码 不 能 通过 编译 。 有 什么 问 
题 吗 ? 


private Item[] item = new Item[capacity]; 


答 : 这 是 一 个 好 的 尝试 。 遗 憾 的 是 ，Java 不 允许 创建 泛 型 数组 。 专 家 们 仍 在 积极 地 争 
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论 这 一 决定 。 像 通常 一 样 ， 对 编程 语言 特性 的 抱怨 太 多 会 让 我 们 逐渐 变 成 一 个 编程 语言 设计 
师 。 解 决 这 个 问题 有 一 个 办 法 ， 使 用 强制 转换 。 你 可 以 这 样 写 : 


private Item[] item = (Item[]) new Object[capacity]; 


问 : 为 什么 导入 的 类 是 Java.util.Iterator 而 不 是 Java.lang.Iterable ? 

答 : 这 是 历史 原因 ， 接 口 Iterator 是 Java.util 包 的 一 部 分 ， 默 认 情 况 下 不 导入 。 接 口 
Iterable 是 相对 较 新 的 ， 且 作为 Java.lang 包 的 一 部 分 ， 会 被 默认 导入 。 

问 : 请 问 可 以 在 数组 中 使 用 foreach 语句 吗 ? 

答 : 可 以 (即使 在 技术 上 ， 数 组 没有 实现 Iterable 接口 )。 以 下 代码 用 于 将 命令 行 参数 打 
印 到 标准 输出 : 


public static void main(String[] args) 


for (String s : args) 
Stdout.print1ln(s) ; 
} 


问 : 请 问 在 使 用 泛 型 时 ， 如 果 在 声明 或 构造 函数 调用 中 省 略 type 参数 ， 会 发 生 什么 
情况 ? 

Stack<String> stack = new StackQ); /Y 不 安全 

Stack stack = new Stack<String>();  ”// 不 安全 

Stack<String> stack = new Stack<String>();  // 正确 

答 : 第 一 个 语句 会 产生 编译 时 警告 。 第 二 个 语句 不 直接 产生 警告 ， 但 是 如 果 使 用 String 
参数 调用 stack.push()， 并 且 将 stack.pop() 的 结果 分 配给 String 类 型 的 变量 ， 则 会 产生 编译 
时 警告 。 作 为 第 三 个 语句 的 替代 ， 我 们 可 以 使 用 钻石 运算 符 (diamond operator) , 它 人 允许 
Java 从 上 下 文 推断 构造 函数 调用 的 类 型 参数 : 


Stack<String> stack = new Stack<>(); // 钻石 运算 符 


问 : 为 什么 不 能 有 个 Collection 数据 类 型 ， 可 以 添加 项 、 删 除 最 近 插 入 的 项 、 移 除 最 早 
插入 的 项 、 删 除 一 个 随机 项 、 和 迭代 访问 这 些 项 、 返 回 集合 中 的 项 数 ， 以 及 任何 我 们 可 能 需要 
的 其 他 操作 ? 然后 ， 我 们 可 以 让 它们 都 实现 在 一 个 类 中 ， 可 以 被 许多 客户 程序 使 用 。 

答 : 这 是 一 个 宽泛 接口 (wide interface) 的 例子 ， 正 如 我 们 在 3.3 节 中 指出 的 那样 ， 我 
们 应 该 避免 这 样 的 编程 。 避 免 宽泛 接口 的 一 个 原因 是 很 难 构造 对 所 有 操作 都 有 效 的 实现 。 一 
个 更 重要 的 原因 是 ， 窄 接口 可 以 强调 程序 的 某 些 规 则 ， 从 而 使 得 客户 程序 代码 更 容易 理解 。 
如 果 一 个 客户 程序 使 用 Stack<String>， 而 另 一 个 使 用 Queue<Customer>， 我 们 很 容易 理解 
第 一 个 程序 强调 LIFO 规则 ， 而 第 三 个 程序 强调 FIFO 规则 。 另 一 个 方法 是 使 用 继承 尝试 封 
装 对 所 有 集合 都 通用 的 操作 。 人 然而， 我 们 建议 此 类 实现 交 给 专家 们 去 完成 ， 程 序 员 则 可 以 学 
习 构 建 通 用 数据 类 型 实现 ， 如 Stack 和 Queue。 


练习 


4.3.1 将 一 个 方法 isFull0 添加 到 ArrayStackOfStrings (程序 4.3.1 )， 如 果 栈 大 小 等 于 数组 容量 ， 则 返 
回 true。 修 改 push() 使 其 在 栈 已 满 时 引发 异常 。 
4.3.2 给 出 “Java ArrayStackOfStrings 5” 命 令 针对 以 下 输入 的 输出 结果 : 


it was - the best - of times - - - it was - the - - 
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4.3.3 假设 一 个 客户 程序 在 一 个 栈 上 执行 了 一 系列 push 入 栈 和 pop 出 栈 的 混合 操作 。 和 栈 操作 把 整数 
0 至 9 按 顺 序 压 人 栈 ; 出 栈 操作 输出 返回 的 结果 值 。 下 列 序列 中 ， 哪 一 个 不 可 能 出 现 ? 


a.4321098765 W08753290 
c.2567489310 dU4321056789 
ET 046535381 029 
g.1479865302 h.2143658790 
4.3.4 ”编写 一 个 栈 的 客户 程序 Reverse， 从 标准 输入 读 取 字符 串 ， 并 按 相 反 顺 序 写 人 到 标准 输出 。 使 
用 栈 或 队列 。 


4.3.5 ”编写 一 个 静态 方法 ， 从 标准 输入 中 逐个 读 取 若干 个 浮 点 数 ， 一 次 一 个 ， 并 按照 它们 在 标准 输入 
上 出 现 的 顺序 返回 一 个 包含 它们 的 数组 。 提 示 : 使 用 堆栈 或 队列 。 

4.3.6 ”编写 一 个 栈 的 客户 程序 Parentheses， 从 标准 输入 中 读 取 一 串 小 括号 、 方 括号 和 大 括号 的 括号 字 
符 串 ， 并 使 用 栈 来 确定 它们 是 否 正确 配对 。 例 如 ， 对 于 “[O] {} {[00]0}”， 程 序 结 果 为 true ; 
对 于 “[(] ”程序 结果 为 false。 提 示 : 使 用 栈 。 

4.3.7 ”请 问 当 n 为 50 时 ， 下 面 的 代码 片段 会 打印 什么 ?给 定 正 整数 n， 请 描述 如 下 代码 片段 所 实现 的 功能 。 


Stack<Integer> stack = new Stack<Integer>(); 
while (n > 0) 
{ 

stack.push(n % 2); 

n /= 2; 


} 

while (!stack.isEmpty()) 
StdOut.print(stack.popO); 

StdOut.print1nO); 


答案 : 该 代码 打印 n 的 二 进 制 表 示 (n 为 50 时 ,结果 为 110010 )。 
4.3.8 下面 的 代码 片段 对 队列 queue 的 操作 结果 是 什么 ? 


Stack<String> stack = new 9Stack<String>() ; 
while (!queue.isEmpty()) 
stack.push(queue.dequeue()); 
while (!stack.isEmpty()) 
queue .enqueue(stack.pop()) ; 


4.3.9 ”将 方法 peek() 添加 到 Stack( 程 序 4.3.4 ) 中 ， 用 于 返回 栈 中 最 近 插 和 人 的 项 目 〈 但 不 删除 这 个 项 目 )。 
4.3.10 ”使 用 如 下 输入 ， 程 序 ResizingArrayStackOf 每 次 操作 后 数组 的 内 容 和 长 度 分 别 是 什么 ? 


it was - the best - of times -- - it was - the - - 


4.3.11 向 Stack (程序 4.3.4) 和 Queue (程序 4.3.6) 中 添加 方法 size()， 返 回 集合 中 数据 项 的 数 
量 。 提示: 维护 一 个 实例 变量 n， 初始化 为 0 ; n 在 push() 和 enqueue( 时 递增 , 在 pop() 和 
dequeue() 时 递减 ， 在 调用 size() 时 返回 其 值 ， 确 保 你 采用 的 方法 可 以 在 常量 时 间 内 运行 。 

4.3.12 按 4.1 节 中 图 表 的 样式 绘制 一 个 内 存 使 用 图 ， 用 于 描述 本 节 介 绍 链表 时 所 使 用 的 三 个 节点 示例 。 

4.3.13 ”编写 一 个 程序 ， 从 标准 输入 中 接收 一 个 没有 左 括号 的 表达 式 ， 输 出 相应 的 中 缀 表达 式 ， 注 意 
适当 插入 配对 的 括号 。 例 如 ， 对 于 给 定 的 输入 : 


bl 


程序 应 该 输出 : 
CT 3 


615 
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4.3.14 
4.3.15 


4.3.16 


4.3.17 


4.3.18 


4.3.19 


4.3.20 


4.3.21 


4.3.22 


4.3.23 


4.3.24 


获 4 间 


编写 一 个 过 滤器 程序 InfixToPostfix; 将 算术 表达 式 从 中 绥 形 式 转换 为 后 缀 形式 。 
编写 一 个 程序 EvaluatePostfix， 程序 从 标准 输入 读 取 一 个 后 缀 表达 式 ， 对 该 表达 式 进行 计算 并 
在 标准 输出 上 显示 结果 (将 前 一 个 题目 的 程序 输出 连接 到 本 程序 ， 其 行为 等 价 于 程序 4.3.5 中 
的 Evaluate ) 。 

假设 一 个 客户 程序 在 一 个 FIFO 队列 上 执行 一 系列 enqueue 和 dequeue 操作 。enqueue 操作 将 
整数 0 到 9 依次 插入 队列 中 ;dequeue 操作 输出 返回 的 结果 值 。 请 问 下 列 哪 一 个 序列 是 不 可 能 
出 现 的 ? 

a.0123456789 b ,4687532901 

c.2567489310 d.4321056789 

编写 一 个 可 迭代 Stack 的 客户 程序 使 用 静态 方法 copy0， 将 一 个 字符 串 栈 作为 参数 并 返回 这 
个 栈 的 一 个 副本 。 练 习 4.3.48 中 还 有 这 个 问题 的 另 一 种 解法 。 

编写 一 个 Queue 的 客户 程序 ， 从 命令 行 接收 一 个 参数 k， 并 从 标准 输入 获取 一 个 字符 串 ， 在 该 
字符 串 中 查找 并 输出 倒数 第 k 个 字符 。 

开发 一 个 数据 类 型 ResizingArrayQueueOfStrings， 首 先 基 于 一 个 固定 长 度 的 数组 实现 一 个 队 
列 ， 使 得 所 有 的 操作 时 间 复 杂 度 都 是 一 样 的 。 然 后 ， 扩 展 这 个 实现 使 用 可 变数 组 来 摆脱 长 度 
限制 。 提 示 : 难点 是 当 项 目 被 添加 到 队列 中 或 从 队列 中 移 除 时 ， 项 目 会 在 数组 中 “ 折 回 ” 。 请 
使 用 算术 取 模 来 维护 记录 队列 前 端 和 后 端 项 的 数组 索引 下 标 。 








StdIn StdOut n lo hi ee 
0 1 之 3 4 3 6 7 
0 0 0 null 
to 1 0 1 to null 
be 2 0 2 to be 
or 3 0 3 to be or null 
not 4 0 4 to be or not 
to 5 0 5 to be or not to null null null 
二 to 4 1 4 null be or not to null nulT null 
be 5 1 6 null be or not to be null null 
= be 4 2 6 null null or not to be _ null null 
- or 3 3 6 null null null not to not null null] 
that 4 3 7 null null nlT nat to not that nwll 


(这 个 问题 倾向 于 数学 题 ) 证 明 ResizingArrayStackOfStrings 中 的 数组 永远 不 会 少 于 四 分 之 一 
满 。 然 后 证 明 ， 对 于 任何 ResizingArrayStackOfStrings 客户 程序 来 说 ， 所 有 栈 操作 的 总 成 本 除 
以 操作 次 数 都 是 在 一 个 常量 限度 内 。 

修改 MM1Queue (程序 4.3.7 ) 为 程序 MD1Queue， 在 新 程序 中 模拟 一 个 队列 ， 其 服务 时 间 采 
用 固定 (确定) 速率 。 针 对 这 个 模型 ， 验 证 利 特 尔 定律 。 

开发 一 个 类 StackOfInts， 使 用 链表 表示 (不 使 用 泛 型 ) 来 实现 整数 栈 。 并 编写 一 个 客户 程序 ， 
将 实现 的 性 能 与 Stack<Integer> 进行 比较 ， 以 确定 系统 中 自动 装 箱 和 拆 箱 的 性 能 损失 。 

假设 x 是 一 个 链表 节点 。 请 问 下 列 代码 片段 的 作用 是 什么 ? 

x.next = x.next.next; 

答案 : 从 列表 中 删除 紧 跟 在 x 之 后 的 一 个 节点 。 

编写 一 个 方法 find()， 将 链表 中 的 第 一 个 节点 和 一 个 字符 串 key 作为 参数 ， 如 果 链 表 中 某 个 节 
点 的 数据 项 值 是 key, 则 返回 true, 否则 返回 false。 


433325 


4.3.26 


4.3.27 


4.3.28 


4.3.29 


4.3.30 


4.3.31 


4.3.32 
4.3.33 


4.3.34 


4.3.35 
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编写 一 个 方法 delete()， 该 方法 将 链表 中 的 第 一 个 节点 和 一 个 整数 k 作 为 参数 ， 删 除 链表 中 的 
第 k 个 元 素 (如 果 存在 的 话 )。 
假设 x 是 一 个 链表 节点 。 以 下 代码 片段 的 作用 是 什么 ? 


t.next = x.next; 
x.next = t; 


答案 : 在 节点 x 之 后 立即 插入 节点 te 
为 什么 下 面 的 代码 片段 与 上 一 个 问题 中 的 代码 片段 没有 相同 的 效果 ? 


x.next = t; 
t.next = x.next; 


答案 : 当 执 行 到 更 新 t.next 的 时 候 ，x. next 已 经 不 再 是 x 后面 的 原始 节点 ,而 是 t 本 身 ! 
编写 一 个 方法 removeAfter()， 参 数 为 一 个 链表 节点 ， 然 后 移 除 给 定 的 节点 的 下 一 个 节点 (如 
果 参 数 为 null 或 参数 的 下 一 个 字段 为 null 则 不 执行 任何 操作 )。 

编写 一 个 方法 copy()， 参 数 为 一 个 链表 节点 ， 创 建 一 个 新 的 链表 ， 包 含 与 给 定 链表 具有 相同 项 
目的 序列 ， 注 意 保 持原 始 链表 不 变 。 

编写 一 个 方法 remove()， 参 数 为 一 个 链表 的 节点 和 一 个 字符 串 key， 删 除 链表 中 所 有 项 目 为 
key 的 节点 。 

编写 一 个 方法 max()， 将 链表 中 的 第 一 个 节点 作为 参数 ， 返 回 列表 中 最 大 项 的 值 。 假 设 所 有 项 
都 是 正 整数 ， 如 果 链 表 为 空 则 返回 0。 

针对 上 一 个 问题 开发 一 个 递归 的 解决 方案 。 

编写 一 个 方法 ， 将 链表 中 的 第 一 个 节点 作为 参数 ， 反 转 列表 ， 并 返回 结果 链表 中 的 第 一 个 
节点 。 

编写 一 个 递归 方法 ， 反 向 输出 链表 中 的 项 目 。 请 不 要 修改 链表 中 的 任何 链接 。 简 单方 法 : 使 用 
二 次 型 运行 时 间 ， 加 上 常量 型 额外 空间 。 另 外 一 种 简单 的 方法 : 使 用 线性 运行 时 间 ， 加 上 线 
性 额外 的 空间 。 复 杂 方 法 : 开发 一 个 需要 线性 时 间 并 使 用 对 数额 外 空间 的 分 而 治之 的 算法 。 
编写 一 个 递归 方法 ， 通 过 修改 链接 的 方式 随机 混 洗 链 表 的 节点 。 简 单方 法 : 使 用 二 次 型 运行 时 
间 ， 常 量 型 额外 空间 。 复 杂 方 法 : 开发 一 个 分 而 治之 算法 ， 需 要 线性 对 数 型 运行 时 间 和 对 数 
型 额外 空间 。 有 关 “ 合 并 ” 步 又 请 参见 练习 1.4.40。 


创新 练习 


4.3.36 


4.3.37 


Deque。Deque (发 音 为 “ deck”) 是 一 个 双 端 队列 ,是 一 个 由 栈 和 队列 组 成 的 集合 。 编 写 一 个 
Deque 类 ， 使 用 链表 实现 下 列 API: 


public class Deque<Item> 


Deque() 新 建 一 个 空 的 双 端 队列 
boolean isEmpty() 双 端 队列 为 空 ? 
void enqueue(Item item) 向 队 尾 添加 项 
void push(Item item) 向 队 首 添加 项 
Item popO) 在 队 首 处 移 除 并 返回 项 
Item dequeue() 在 队 尾 处 删除 并 返回 项 


双 端 队列 的 泛 型 API 
随机 队列 。 随 机 队列 是 支持 以 下 API 的 集合 : 


360 


4.3.40 


4.3.41 


4.3.42 


伪 了 茧 


public class RandomQueue<Item> 





RandomQueueO) 新 建 一 个 空 的 随机 队列 
boolean isEmpty() 随机 队列 为 空 ? 
void enqueue(Item item) ”向 随机 队列 中 添加 项 
Item dequeue() 取出 并 返回 一 个 随机 项 ( 不 重 置 采样 ) 
Item sample() 返回 一 个 随机 项 目 ， 但 不 要 删除 ( 重 置 采样 ) 
随机 队列 的 泛 型 API 


编写 一 个 类 RandomQueue 实现 这 个 API。 提 示 : 使 用 可 变数 组 。 要 删除 一 个 项 目 , 将 随机 
位 置 (索引 下 标 为 0 到 n-1 ) 的 项 与 最 后 位 置 (索引 n-1 ) 的 项 交换 ， 然 后 删除 并 返回 随机 队列 
的 最 后 一 个 项 ， 如 ResizingArrayStack 中 所 示 。 编 写 一 个 客户 程序 ， 使 用 RandomQueue<Card> 
输出 一 副 随机 顺序 的 扑克 牌 。 
随机 迭代 器 。 为 上 一 个 练习 中 的 RandomQueue<Item> 编写 一 个 迭代 器 ， 以 随机 顺序 返回 项 
目 。 不 同 的 迭代 器 应 该 以 不 同 的 随机 顺序 返回 项 目 。 注 意 : 这 个 练习 做 起 来 比 看 起 来 困难 。 
约瑟夫 (Josephus) 问题 。 约 瑟 夫 问题 是 一 个 古老 的 问题 ， 在 这 个 问题 中 有 nn 个 人 陷入 困境 ， 
一 致 同意 按 以 下 策略 减少 人 口 。 他 们 排列 成 一 个 圈 (从 0 到 nn-1 的 位 置 )， 然 后 由 第 一 个 人 
开始 按照 圆圈 报 数 ， 每 报 数 到 第 m 个 人 就 杀 掉 这 个 人 ,然后 再 由 下 一 个 人 重新 报 数 ， 直 到 只 
剩 下 最 后 一 个 人 。 据 说 约瑟夫 想 知 道 坐 哪里 可 以 避免 被 杀 死 。 便 编写 一 个 Queue 的 客户 程序 
Josephus， 从 命令 行 接收 两 个 整数 参数 m 和 n， 并 输出 人 们 被 杀 死 的 顺序 (从 而 确定 约瑟夫 坐 
在 圆圈 中 的 位 置 )。 


% java Josephus 2 7 
13 50.26 


广义 队列 。 实 现 一 个 支持 以 下 API 的 类 ， 通 过 支持 删除 第 i 个 最 近 插 入 的 项 来 泛 化 队列 和 栈 : 


public class GeneralizedQueue<Item> 


GeneralizedQueue() 创建 一 个 空 的 广义 队列 





boolean isEmpty() 广 叉 队列 是 空 的 吗 
void add(Item item) 将 item 插 入 广义 队列 
Item remove(int i) 删除 并 返回 第 i 个 最 近 插 入 的 项 目 
int size() 队列 中 的 项 目 数 
通用 广义 队列 的 API 


首先 ， 开 发 一 个 使 用 可 变数 组 的 实现 ， 然 后 开发 一 个 使 用 链表 的 实现 (有关 使 用 二 叉 查找 
树 的 更 为 有 效 的 实现 请 参见 练习 4.4.57 )。 
环形 缓冲 区 。 环 形 缓冲 区 (或 循环 队列 ) 是 一 个 FIFO 集合 ， 用 于 存储 一 系列 项 ， 其 中 项 数 的 
上 限 是 已 知 的 。 如 果 将 项 插入 已 满 的 环形 缓冲 区 中 ， 新 项 会 替换 最 早 插 和 人 的 项 。 环 形 缓冲 区 
可 用 于 在 异步 进程 间 传 输 数 据 和 存储 日 志文 件 。 当 缓冲 区 为 空 时 ， 用 户 等 待 直到 数据 存 人 其 
中 ; 当 缓 冲 区 为 满 时 ， 生 产 者 暂停 存放 数据 。 为 环形 缓冲 区 开发 一 个 API， 并 给 出 一 个 基于 数 
组 表示 的 实现 。 
合并 两 个 有 序 的 队列 。 给 定 两 个 按 升序 排列 的 字符 串 序 列 ， 将 所 有 字符 串 移 动 到 第 三 个 字符 
串 序 列 中 ， 同 时 保证 第 三 个 队列 的 结果 也 按 升序 排列 。 


4.3.43 


4.3.44 


4.3.45 


4.3.46 


4.3.47 


4.3.48 


4.3.49 


4.3.50 
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非 递 归 的 归并 排序 。 给 定 n 个 字符 串 ， 创建 个 队列 ,每 个 队列 包含 一 个 字符 串 。 创 建 一 个 
包含 nn 个 队列 的 队列 。 然 后 ， 应 用 前 一 个 练习 中 的 排序 合并 操作 将 队列 中 的 前 两 个 队列 合并 ， 
并 将 合并 后 的 队列 插入 尾 端 。 重 复 此 过 程 直 到 这 个 队列 的 队列 只 包含 一 个 队列 。 

双 栈 队列 。 请 使 用 两 个 栈 实现 一 个 队列 。 提 示 : 如 果 将 项 压 栈 ， 然 后 全 部 弹出 ， 则 它们 将 以 相 
反 的 顺序 出 现 。 重 复 这 个 过 程 使 得 它们 回 到 FIFO 顺序 。 

移动 到 前 端 (Move-to-front)。 从 标准 输入 中 读 取 一 系列 字符 ， 把 字符 保存 在 一 个 链表 中 ， 假 
设 字 符 没有 重复 。 当 读 取 一 个 新 的 字符 时 将 其 插入 链表 的 前 端 。 当 读 取 一 个 重复 字符 时 ， 
从 链表 中 删除 该 字符 并 重新 插入 链表 的 开头 。 这 样 ， 程 序 就 实现 了 众所周知 的 移动 到 前 端 策 
略 。 这 个 策略 可 以 用 于 缓存 、 数 据 压缩 以 及 许多 其 他 应 用 程序 ， 因 为 一 个 最 近 被 访问 的 项 目 
更 有 可 能 被 重新 访问 。 

拓扑 排序 。 服 务 器 上 编号 从 0 到 n-1 的 n 个 作业 需要 进行 排序 。 有 些 工作 必须 先 完成 ， 其 他 
工作 才能 开始 。 编 写 一 个 程序 TopologicalSorter， 它 接收 一 个 命令 行 参 数 n 和 标准 输入 的 一 
系列 有 序 的 作业 对 “ij”， 然 后 输出 一 个 整数 序列 ， 使 得 对 于 输入 的 每 一 个 作业 对 “二 ， 作 
业 i 总 出 现在 作业 j 之 前 。 使 用 以 下 算法 : 首先 ， 从 输入 中 为 每 个 作业 构建 : Q 一 个 必须 跟 ”L620 
随 该 作业 的 作业 队列 : @ 这 个 节点 的 入 度 (必须 在 其 之 前 完成 的 作业 数 )。 然 后 ， 构 建 一 个 
所 有 人 度 为 0 的 节点 的 队列 ,重复 删除 入 度 为 0 的 所 有 作业 ， 并 更 新 所 有 的 数据 结构 。 这 
个 过 程 有 很 多 实际 应 用 。 例如， 可 以 使 用 它 来 为 你 的 专业 建立 课程 排序 (使 得 你 开始 修 读 某 
门 课时 ,， 它 所 需要 的 前 序 课程 都 已 修 读 过 一 一 译 者 注 )， 以 便 你 可 以 选修 一 系列 课程 ， 从 而 
顺利 毕业 。 

文本 编辑 缓冲 区 。 请 开发 一 个 数据 类 型 ， 用 于 文本 编辑 器 的 缓冲 区 ， 实 现 如 下 API: 


public class Buffer 





Buffer() 创建 一 个 空 的 缓冲 区 
void insert(char cy) 在 光标 位 置 插入 < 
char delete() 删除 并 返回 光标 处 的 字符 
void left(Cint k) 将 光标 k 的 位 置 向 左 移动 
void rightCint k) 将 光标 k 的 位 置 向 右 移动 
int size() 缓冲 区 中 的 字符 数 
文本 缓冲 的 API 


提示 : 使 用 两 个 栈 。 
复制 堆栈 的 构造 函数 。 为 Stack 的 链表 实现 创建 一 个 新 的 构造 函数 : 


Stack<Item> t = new Stack<Item>(s); 


以 上 代码 使 得 t 引 用 队列 s 的 一 个 新 的 独立 拷贝 。 这 一 名 完成 后 ， 从 s 或 + 进行 压 人 和 弹 
出 操作 应 该 不 影响 另 一 方 。 
复制 队列 的 构造 函数 。 创 建 一 个 新 的 构造 函数 : 


Queue<Item> r = new Queue<Item>(q) ; 


使 得 队列 成 为 对 队列 q 的 新 的 独立 拷贝 的 引用 。 621 
Quote。 开 发 一 个 数据 类 型 Quote, 用 于 实现 以 下 API: 
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4.3.51 


4.3.52 


4.3.53 


4.3.54 


4.3.55 


4.3.56 


4.4 


锣 4 草 


public class Quote 





Quote() 创建 一 个 空 的 Quote 
void add(String word) 将 word 附 加 到 Quote 的 末尾 
void add(int i, String word) 在 索引 i 处 插入 word 
String get(int i) 返回 索引 i 的 单词 
int count() Quote 中 的 单词 数 
String toString() Quote 中 的 单词 
quote 的 API 


为 此 ， 请 定义 一 个 谋 套 类 Card， 它 包含 引文 中 的 一 个 单词 和 指向 引文 中 下 一 个 单词 的 链接 : 


private class Card 


{ 
private String word; 
private Card next; 


public Card(String word) 
: this.word = word; 
this.next = null; 

} 
循环 quote。 重 复 上 一 个 练习 ， 但 使 用 循环 链表 。 在 循环 链表 中 ， 每 个 节点 指向 其 后 继 ， 列 表 
中 的 最 后 一 个 节点 指向 第 一 个 节点 (而 不 是 null， 标 准 链表 中 最 后 一 个 节点 指向 null)。 
链表 反 向 (迭代 )。 编 写 一 个 非 递 归 函 数 ， 它 将 链表 中 的 第 一 个 节点 作为 参数 ,并 反 转 列表 ， 
返回 结果 中 的 第 一 个 节点 。 
链表 反 向 (递归 )。 编 写 一 个 递归 函数 ， 它 将 链表 中 的 第 一 个 节点 作为 参数 ， 并 反 转 列表 ， 返 
回 结 果 中 的 第 一 个 节点 。 
队列 模拟 。 将 MM1Queue 改 为 使 用 栈 实现 ， 而 不 是 队列 ， 会 发 生 什 么 ? 利 特 尔 定律 是 否 依旧 
成 立 ? 针对 一 个 随机 队列 ， 请 回答 相同 的 问题 。 绘 制 直方 图 ， 比 较 等 待 时间 的 标准 偏差 。 
负载 均衡 模拟 。 修 改 LoadBalance， 输 出 平均 队列 长 度 和 最 大 队列 长 度 (而 不 是 绘制 直方 图 )， 
并 使 用 修改 后 的 程序 来 运行 在 100 000 个 队列 上 分 配 100 万 个 项 目的 情况 ， 输 出 100 次 试验 
(每 次 采样 大 小 为 1、2、3 和 4) 的 最 大 队列 长 度 的 平均 值 。 请 问 你 的 实验 是 否 验证 了 正文 中 
使 用 采样 大 小 为 2 的 结论 ? 
文件 列表 。 文 件 夹 是 文件 和 文件 夹 的 列表 。 编 写 一 个 程序 将 文件 夹 的 名 称 作为 命令 行 参数 ， 
输出 该 文件 夹 下 包含 的 所 有 文件 ， 每 个 文件 夹 的 内 容 在 该 文件 夹 的 名 称 下 递归 列 出 (采用 缩 进 
方式 )。 提 示 : 使 用 队列 ， 参 考 Java.io.File。 


符号 表 


符号 表 (symbol table) 是 一 种 数据 结构 ， 用 于 将 数值 与 关键 字 关联 。 客 户 程序 可 以 通过 
指定 一 个 键 值 对 将 一 个 项 目 存 储 到 (put) 符号 表 中 ， 然 后 从 符号 表 中 检索 (get) 对 应 于 特定 
键 的 值 。 例 如 ， 一 所 大 学 可 能 把 一 个 学 生 的 姓名 、 家 庭 地 址 、 成 绩 等 ( 值 ) 与 该 学 生 的 社会 
安全 号 码 ( 键 ) 相关 联 ， 以 便 通过 指定 的 社会 安全 号 码 来 访问 每 个 学 生 的 记录 信息 (社会 安 
全 号 码 为 美国 社会 的 唯一 标识 ， 类 似 我 国 的 身份 证 号 码 一 一 译 者 注 )。 同 样 的 方法 适用 于 科 
学 家 组 织 数 据 、 企 业 跟 踪 客 户 交易 信息 、Internet 搜索 引擎 关联 关键 字 和 网 页 ， 或 者 其 他 许 
多 应 用 场景 。 
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在 本 节 中 ， 我 们 讨论 符号 表 数 据 类 型 的 基本 API。 除 put 和 get 操作 外 ， 我们 的 API 还 
包括 测试 是 否 存 在 值 与 一 个 给 定 键 相 关联 ( contains)、 移 除 键 (以 及 相关 联 的 值 )、 确 定 符号 
表 中 键 值 对 的 数量 ( size)， 以 及 对 符号 表 中 的 键 遍历 访问 的 功能 。 我 们 也 会 讨论 在 各 种 应 用 
中 自然 产生 的 符号 表 上 的 其 他 基于 元 素 顺 序 的 操作 。 

作为 动力 ， 我们 讨论 两 个 典型 的 客户 程序 一 一 字典 查找 和 索引 ， 并 简要 地 讨论 它们 在 实 
际 中 的 应 用 。 类 似 的 客户 程序 是 基本 的 工具 ， 它 们 经 常 以 某 种 形式 在 每 个 计算 环境 中 呈现 ， 容 
易 当 成 理所当然 的 而 忽略 其 原理 ， 也 容易 产生 误 用 。 同 任何 复杂 的 工具 一 样 ， 想 要 高 效 地 使 
用 字典 或 者 索引 ， 必 须 了 解 它们 是 如 何 构建 的 。 这 就 是 我 们 在 本 节 中 详细 研究 符号 表 的 原因 。 

由 于 其 本 质 上 的 重要 性 ， 符 号 表 自 计算 初期 就 被 广泛 使 用 和 研究 。 我 们 讨论 两 个 经 典 实 
现 。 第 一 个 是 散 列 操作 ， 用 于 将 键 转换 为 数组 索引 下 标 以 访问 值 。 第 二 种 是 基于 二 又 搜索 树 
(BST) 的 数据 结构 。 两 个 实现 都 是 非常 简单 的 解决 方案 ， 在 许多 应 用 场景 中 性 能 良好 ， 可 以 
作为 现代 程序 设计 环境 中 工业 级 符号 表 实 现 的 基础 。 我 们 认为 散 列 和 二 又 搜索 树 的 代码 比 我 
们 讨论 过 的 栈 和 队列 中 的 链表 代码 稍微 复杂 一 点 ,但 它 将 会 引领 你 进入 一 个 具有 深远 影响 的 
数据 结构 的 新 维度 。 

API 符号 表 (symbol table) 是 一 个 键 - 值 对 的 集合 。 我 们 使 用 泛 型 key 表示 键 和 泛 型 
Value 来 表示 值 。 每 一 个 符号 表 项 保存 一 个 值 与 一 个 键 的 关联 。 这 些 假设 即 可 得 出 以 下 几 个 
基本 API: 


public class *ST<Key, Value> 








*ST() 创建 一 个 空 的 符号 表 

void put(Key key, Value val) 将 val 与 key 建 立 关联 

Value get(Key key) 获取 与 key 相 关联 的 值 
void remove(Key key) 删除 键 key 及 其 对 应 的 值 
boolean contains(Key key) 是 否 存 在 对 应 于 key 的 值 

int sizeQO 键 - 值 对 的 数量 
Iterable<Key> keys() 返回 符号 表 中 所 有 的 键 
泛 型 化 符号 表 的 ,API 


同 之 前 一 样 ,“* ”是 一 个 占 位 符 ,， 表 明 可 以 考虑 多 种 实现 。 在 本 节 中 ， 我 们 提供 了 两 
个 经 典 实现 : HashST, 和 BST (我 们 在 文中 也 简要 介绍 了 一 些 基 本 的 实现 )。 这 个 API 反映 了 
若干 设计 选择 ， 我 们 将 逐一 展开 讨论 。 

不 可 变 键 。 我 们 假设 键 在 符号 表 中 保持 值 不 变 。 最 简单 和 最 常用 的 键 类 型 包括 String 类 
型 和 内 置 包装 类 型 (如 Integer 和 Double)， 并 且 通 常 假 设 键 的 值 是 不 可 变 的 。 

替换 旧 值 策略 。 如 果 要 将 一 个 值 关 联 到 一 个 已 经 包含 关联 值 的 键 ， 我 们 采用 新 值 替换 旧 
值 的 一 贯 原则 (就 像 使 用 赋值 语句 给 数组 元 素 赋值 )。 如 果 需 要 ，contains() 方法 为 客户 提供 
了 避免 这 种 操作 的 灵活 性 。 

不 存在 。 如 果 符 号 表 中 不 存在 与 指定 键 相关 的 值 ，get() 方法 返回 null。 这 个 选择 有 两 个 
含义 ， 接 下 来 讨论 。 

空 键 和 空 值 。 不 允许 客户 将 null 用 作 键 或 值 。 这 个 规定 使 我 们 能 够 按照 如 下 所 示 实 现 
contains(): 


public boolean contains(Key key) 
{ return get(key) != null; } 
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移 除 。 我 们 讨论 的 符号 表 API 中 还 包含 从 符号 表 中 删除 键 (及 其 相关 联 的 值 ) 的 方法 ， 
因为 许多 应 用 程序 确实 需要 这 种 方法 。 但 是 ,简便 起 见 ， 我 们 将 移 除 功 能 的 实现 推迟 到 练习 
或 算法 和 数据 结构 这 样 更 高 级 的 课程 中 。 

遍历 键 - 值 对 。keys() 方 法 为 客户 提供 了 遍历 数据 结构 中 键 - 值 对 的 方法 。 为 了 简便 ， 
它 只 返回 键 ; 如 果 需 要 ， 客 户 可 以 使 用 get 来 获取 键 相关 联 的 值 。 客 户 程序 代码 如 下 所 示 : 


ST<String, Double> st = new ST<String, Double>O); 


for (String key : st.keys()) 


StdOut.printin(key + " 


"+ st.get(key)); 


散 列 键 。 像 许多 语言 一 样 ，Java 为 符号 表 的 实现 直接 提供 了 所 需 的 语言 和 系统 支持 。 具 
体 而 言 ， 每 种 类 型 的 对 象 都 有 一 个 equals() 方法 (我 们 可 以 使 用 这 个 方法 来 测试 两 个 键 是 否 
相同 ， 正 如 键 数据 类 型 所 定义 的 那样 ) 和 一 个 hashCode() 方法 ( 它 支 持 特定 类 型 的 符号 表 的 
实现 ， 我 们 将 在 本 节 稍 后 讨论 )。 对 于 最 常用 的 键 的 标准 数据 类 型 我们 可 以 依赖 于 这 些 方 
法 的 系统 实现 。 相 反 ， 对 于 我 们 创建 的 数据 类 型 ， 我 们 必须 仔细 考虑 实现 ， 如 3.3 节 所 讨论 
的 。 大 多 数 程序 员 只 是 简单 地 假设 所 有 需要 的 功能 都 已 被 妥善 实现 ， 但 实际 上 并 不 总 是 这 
样 ， 因 此 在 处 理 自 定 义 的 键 类 型 时 需要 小 心 。 
可 比较 的 键 。 在 许多 应 用 程序 中 ， 键 可 以 是 字符 串 或 其 他 具有 自然 顺序 的 数据 类 型 。 在 
Java 中 ， 如 3.3 节 所 述 ， 我 们 期 望 这 些 键 实现 Comparable 接口 ， 从 而 是 可 比较 的 。 具 有 可 
[626| 比较 的 键 的 符号 表 非 常 重要 ， 其 原因 有 两 个 。 首 先 ， 我 们 可 以 利用 键 的 顺序 来 开发 put 和 
get 的 实现 ， 从 而 保证 API 中 的 性 能 符合 规范 要 求 。 其 次 ， 基 于 可 比较 的 键 可 以 定义 大 量 的 
新 功能 (并 且 也 不 难 实现 )。 一 个 客户 程序 也 许 需要 最 小 键 、 最 大 键 、 中 间 键 或 按 某 种 顺序 
遍历 所 有 键 。 算 法 和 数据 结构 的 书籍 中 会 更 加 全 面 而 深入 的 探讨 该 问题 ， 在 本 节 稍 后 部 分 ， 
你 会 学 习 一 个 简单 的 数据 结构 ， 可 以 轻松 地 实现 以 下 显示 的 API 中 详细 介绍 的 操作 。 


public class *ST<Key extends Comparable<Key>, Value> 


void 

Value 

void 

boolean 

int 
Iterable<Key> 


SIT 

put(Key key, Value val) 
get(Key key) 
remove(Key key) 
contains(Key key) 
size() 

keysQ) 

min0) 

max() 

rank(Key key) 
select(int k) 
floor(Key key) 
ceiling(Key key) 


创建 一 个 空 的 符号 表 
将 val 与 key 建 立 关联 
获取 与 key 相 关联 的 值 
删除 键 Key 及 其 对 应 的 值 
是 否 存在 对 应 于 key 的 值 
键 值 对 的 数量 

按照 排 好 序 的 顺序 返回 符号 表 中 所 有 的 键 
返回 最 小 的 键 
返回 最 大 的 键 
小 于 key 的 键 的 数量 

从 小 到 大 排序 的 第 k 个 键 
小 于 等 于 key 的 最 大 键 
大 于 等 于 key 的 最 小 键 


有 序 符号 表 的 API 


符号 表 是 计算 机 科学 中 研究 最 为 广泛 的 数据 结构 之 一 ， 所 以 本 文中 所 讨论 的 符号 表 的 
内 容 和 许多 其 他 替代 设计 的 影响 一 直 以 来 都 被 细致 地 研究 ， 如 果 你 学 习 计算 机 科学 的 后 续 课 
程 ， 将 会 了 解 到 更 多 这 方面 的 知识 。 在 本 节 中 ， 我 们 的 方法 是 通过 考虑 两 个 典型 的 客户 程序 
来 介绍 符号 表 最 重要 的 属性 ， 开 发 两 种 经 典 和 高 效 的 实现 ， 并 研究 两 种 实现 的 性 能 特性 ， 以 
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证 明 它们 能 够 满足 典型 客户 程序 的 需求 (即使 在 符号 表 巨 大 的 情况 下 )。 

符号 表 客户 程序 “一旦 你 获得 了 有 关 符 号 表 的 一 些 理念 和 体验 ， 你 会 发 现 符 号 表 的 用 途 
十 分 广泛 。 为 了 证 明 这 个 事实 ， 我 们 从 两 个 典型 的 例子 开始 ， 它 们 均 可 用 于 大 量 重要 和 熟悉 
的 实际 应 用 程序 。 

字典 查找 。 最 基本 的 符号 表 客 户 程 序 通 过 连续 的 put 操作 来 构建 符号 表 ， 以 支持 get 请 
求 。 我 们 维护 一 组 数据 以 便 需 要 时 可 以 快速 访问 数据 。 大 多 数 应 用 程序 还 充分 利用 了 “符号 
表 是 一 个 动态 字典 ”的 思想 ,不 仅 容 易 查 找 表 中 信息 ， 而 且 可 以 方便 地 更 新 表 中 信息 。 如 下 





例子 说 明了 这 种 方法 的 实用 性 。 

。 电话 薄 。 以 人 名 为 键 ， 以 其 电话 号 码 为 键 值 
值 ， 符 号 表 就 模拟 了 一 个 电话 短 。 与 印 电话 短 姓名 电话 号 码 
刷 电话 秒 的 主要 区 别 在 于 我 们 可 以 添加 字典 单词 释义 
新 的 姓名 或 更 改 现 有 的 电话 号 码 。 我 们 re ee ee 
也 可 以 使 用 电话 号 码 作为 键 姓名 作为 Se PE 和 
相应 的 值 。 如 果 你 从 未 这 样 尝试 过 ,请 病 译 恋 量 名 内 存 地 址 
试 着 在 浏览 器 搜索 框 中 输入 你 的 电话 号 文件 共享 服务 歌曲 名 主机 名 
码 ( 带 区 号 )。 互联 网 域名 解析 (DNS ) ”网址 IP 地 址 

。 词典 。 把 一 个 单词 与 其 释义 联系 起 来 ”典型 的 字典 应 用 


就 是 我 们 常见 的 “词典  。 几 个 世纪 以 

来 ， 人们 在 家 里 和 办 公 室 中 都 放置 了 印刷 的 词典 ， 以 便 查阅 单词 〈 键 ) 的 释义 和 拼写 
( 值 )。 现 在 ， 由 于 性 能 良好 的 符号 表 的 实现 ， 人 们 期 望 在 计算 机 上 实现 内 置 拼写 检查 
器 并 能 够 立即 访问 计算 机 上 的 字 词 释义 。 

账户 信息 。 拥 有 股票 的 人 常常 会 在 网 上 查看 当前 价格 。 网 络 上 的 若干 服务 通常 会 将 股 
票 代 码 ( 键 ) 与 其 当前 的 价格 ( 值 ) 关联 起 来 ,通常 还 包括 许多 其 他 信息 (请 参阅 程 
序 3.1.8)。 此 类 商业 应 用 比比 丝 是 ， 包 括 金 融 机 构 把 账户 信息 与 姓名 或 账号 关联 起 
来 ， 以 及 教育 机 构 将 成 绩 与 学 生 姓名 或 身份 号 码 相 关联 。 

基因 组 学 。 符 号 表 在 现代 基因 组 学 中 扮演 着 重要 的 角色 。 最 简单 的 例子 是 使 用 字母 
A、C、T 和 G 来 表示 生命 体 DNA 中 的 核 苷 酸 。 还 有 一 个 最 简单 的 例子 是 密码 子 ( 核 
苷 酸 三 连 体 ), 和 氨基 酸 之 间 的 对 应 关系 (CTTA 对 应 于 亮 氨 酸 ，TCT 对 应 丝氨酸 等 )， 
以 及 氨基 酸 序列 和 蛋白质 之 间 的 对 应 关系 等 。 基 因 组 学 的 研究 人 员 经 常 使 用 各 种 类 型 
的 符号 表 来 组 织 这 类 知识 。 

实验 数据 。 从 天 体 物理 学 到 动物 学 ， 现 代 科 学 家 被 大 量 实验 数据 淹没 ， 如 何 组 织 并 高 
效 地 访问 这 些 数 据 对 于 理解 这 些 数据 的 含义 至 关 重要 。 符 号 表 是 一 个 关键 的 起 点 ， 基 
于 符号 表 的 高 级 数据 结构 和 算法 已 成 为 科学 研究 的 重要 组 成 部 分 。 

编程 语言 。 符 号 表 的 最 早 应 用 之 一 是 组 织 编程 信息 。 起 初 ， 程 序 只 是 简单 的 二 进 制 数 
序列 ， 但 程序 员 很 快 发 现 使 用 符号 表 代替 操作 指令 和 内 存 地 址 (变量 名 ) 要 方便 得 多 。 
将 名 称 与 数字 关联 需要 符号 表 。 随 着 程序 规模 的 增长 ， 符 号 表 操 作 的 开销 成 为 程序 开 
发 的 瓶颈 ， 最 终 形成 数据 结构 和 算法 的 发 展 需求 ， 就 像 我 们 在 本 节 中 讨论 的 那样 。 
文件 。 我 们 经 常 使 用 符号 表 组 织 计算 机 系统 的 数据 。 也 许 最 突出 的 例子 就 是 文件 系 
统 ， 我 们 将 文件 名 ( 键 ) 与 其 内 容 所 在 的 位 置 ( 值 ) 关联 。 音 乐 播放 器 使 用 相同 的 系 
统 将 歌曲 名 ( 键 ) 与 音乐 本 身 所 在 的 位 置 ( 值 ) 相关 联 。 
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。 互联 网 域名 系统 。 作 为 在 互联 网 上 组 织 信息 的 基础 的 域名 系统 (DNS), DNS 将 人 容易 


理解 的 URL ( 键 ) (如 www.princeton.edu 或 www. 
wikipedia.org) 与 计算 机 网 络 路 由 器 理解 的 IP 地 址 
( 值 )( 如 208.216.181.15 或 207.142.131.206 ) 关联 。 
这 个 系统 是 下 一 代 “ 电 话 短 ”。 因 而 ; 人 类 可 以 
使 用 容易 记忆 的 名 字 来 使 用 网 络 ， 同 时 机 器 可 以 
高 效 地 处 理 这 些 数值 数据 。 在 世界 各 地 的 互联 网 
路 由 器 上 ， 用 于 此 目的 的 符号 表 的 每 秒 查 询 数量 
十 分 巨大 ， 因 此 性 能 是 非常 重要 的 。 每 年 网 络 都 
会 新 增 数 以 百 万 计 的 新 计算 机 和 其 他 设备 ， 因 而 
互联 网 路 由 器 上 的 这 些 符号 表 必 须 是 动态 的 。 
尽管 列举 的 范围 很 广 ， 上 述 列表 还 只 是 一 些 有 代表 
性 的 例子 ， 用 来 向 你 展示 符号 表 抽 象 的 概念 。 每 当 你 通 
过 名 称 来 指定 某 类 事物 时 ， 就 有 一 个 符号 表 在 工作 。 计 
算 机 的 文件 系统 或 网 络 之 所 以 能 为 你 提供 服务 ， 是 因为 
其 后 台 有 一 个 符号 表 。 
例如 ， 要 构建 一 个 将 氨基 酸 名 称 与 密码 子 相 关联 的 
符号 表 ， 可 以 编写 如 下 代码 : 


ST<String, String> amino; 
amino = new ST<String，String>(); 
amino.put("TTA”", "leucine"); 


将 信息 与 关键 字 相 关联 的 想法 非常 重要 ， 许 多 高 级 
语言 都 内 置 了 对 关联 数组 (associative array) 的 支持 ， 你 
可 以 使 用 标准 数组 操作 语法 来 进行 访问 ， 只 是 方 括号 内 
是 键 而 不 是 整数 索引 。 在 这 种 语言 中 ， 你 可 以 写 amino 
["TTA"]=leucine 而 用 再 写 amino.put("TIA"，"leucine")。 尽 
管 Java 还 不 (尚未 ) 支持 这 种 语法 ,但 是 从 关联 数组 的 角 
度 来 看 ， 这 是 理解 符号 表 基本 用 途 的 一 个 好 方法 。 

Lookup (程序 4.4.1 ) 从 命令 行 指 定 的 一 个 有 逗号 分 隔 
值 文件 (参见 3.1 节 ) 中 构建 键 - 值 对 集合 ， 然 后 输出 与 
标准 输入 读 取 的 键 对 应 的 值 。 命 令 行 参数 为 文件 名 和 两 
个 整数 ， 一 个 整数 指定 作为 键 的 字段 ， 另 一 个 指定 作为 
值 的 字段 。 


% more amino.csv 
TTT,Phe,F,Phenylalanine 
TTC, Phe,F,Phenylalanine 
TTA, Leu,L,Leucine 

TTG, Leu,L,Leucine 

TCT, Ser,S,Serine 
TCC,Ser,S,Serine 

TCA, Ser,S, Serine 

TCG, Ser,S, Serine 

TAT, Tyr,Y,Tyrosine 

TAC, Tyr,Y,Tyrosine 

TAA, Stop, Stop, Stop 


GCA,Ala,A,Alanine 
GCG,Ala,A,Alanine 
GAT,Asp,DAspartic Acid 
GAC, Asp,D,Aspartic Acid 
GAA,Gly,G,Glutamic Acid 
GAG,Gly,G,Glutamic Acid 
GCT,Gly,G,Glycine 
GGC,Gly,G,Glycine 
GCA,Gly,G,Glycine 
GGG,Gly,G,Glycine 


% more DJIA.csv 


20-0ct-87,1738.74,608099968,1841.01 
19-0ct-87,2164.16,604300032,1738.74 
16-0ct-87,2355.09,338500000,2246.73 
15-0Oct-87,2412.70,263200000,2355.09 


30-0ct-29,230.98,10730000,258.47 
29-0ct-29,252.38,16410000,230.07 
28-Oct-29,295.18,9210000,260.64 
25-0ct-29,299.47,5920000,301.22 


% more ip.csv 


www.ebay.com;,66.135.192.87 
www.princeton.edu,128.112.128.15 
www.cs.princeton.edu,128.112.136.35 
www.harvard.edu,128.103.60.24 
ww.yale.edu,130.132.51.8 
ww.cnn.com,64.236.16.20 
www.google.com,216.239.41.99 
ww.nytimes.com,199.239.136.200 
www.apple.com,17.112.152.32 
www.slashdot.org,66.35.250.151 
ww.espn.com,199.181.135.201 
www.weather .com,63.111.66.11 
www.yahoo.com,216.109.118.65 


典型 的 逗号 分 隔 值 (CSV 文件 ) 


理解 符号 表 的 第 一 步 是 从 本 书 网 站 下 载 Lookup.java 和 ST.java( 即 我 们 在 本 节 末 尾 将 讨 
论 的 符号 表 实 现 )， 然 后 执行 符号 表 查 询 。 你 可 以 找到 许多 与 我 们 所 描述 的 各 种 应 用 相关 的 
逗号 分 隔 值 (.csv) 文件 ， 包 括 amino.csv (密码 子 的 氨基 酸 编码 )、DJIA.csv (历史 上 每 一 天 
的 股票 的 开盘 价 、 交 易 量 、 收 盘 价 和 股票 市 场 的 平均 值 ) 以 及 ip.csv (DNS 数据 库 的 部 分 项 
目 )。 在 选择 使 用 哪个 字段 作为 键 时 ， 请 记 住 每 个 键 必 须 唯 一 确定 一 个 值 。 如 果 存 在 多 个 put 
操作 将 多 个 值 关联 到 同一 个 键 ， 符 号 表 将 只 记 住 最 近 的 一 个 (考虑 关联 数组 )。 我 们 将 在 后 


续 章 节 讨 论 将 多 个 值 与 一 个 键 相 关联 的 情况 。 
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程序 4.4.1 字典 查找 





public class Lookup 


public static void main(String[] args) 

{ /创建 字典 ， 并 从 标准 输入 读 取 Key 值 
In in = new In(args[0. 
int keyField = Integer. parseInt(args{1])’ 
int valField = Integer.parseInt(args[2]); 


String[] database = in.readAllLinesO; 
StdRandom.shuffle(database); 


ST<String, String> st = new ST<String, String>QO; 
for (int i = 0; i < database.length; i++) 
f 从 一 行 的 输入 信息 中 提取 key 和 values 1 攻 将 共存 入 ST 中 
String[] tokens = database[i].sp]li 
String key = tokens[keyField]; 


String val = tokens[valField]; in 输入 流 (CSV 文 件 ) 
st.put(key, val); keyField | key 的 位 置 
valField | value 的 位 置 

while (!StdIn.isEmpty()) database[] | 输入 的 若干 行 

{ .4 读 取 key 并 输出 值 st 符号 表 (BST) 
String s = StdIn.readString(); tokens 一 行 输 入 的 若干 个 值 
StdOut.println(st.get(s)); kay 

} } val 值 
} s 输入 的 查询 信息 


这 个 符号 表 客 户 程序 从 逗号 分 隔 值 (CSY ) 文件 中 读 取 键 - 值 对 ， 然 后 打 
印 对 应 于 标准 输入 土 键 的 值 。 键 和 值 都 是 字符 串 。 


% java Lookup amino.csv 0 3 % java Lookup ip.csv 0 1 
TTA www.google.com 

Leucine 216.239.41.99 

ABC % java Lookup ip.csv 1 0 
nu11 216.239.41.99 

TCT Www.google.com 

Serine % java Lookup DJIA.csv 0 1 
% java Lookup amino.csv 3 0 29-0ct-29 

Glycine 252.38 

GCG 


在 本 节 稍 后 的 部 分 ， 我 们 将 了 解 到 Lookup 程序 中 put 操作 和 get 请 求 的 时 间 开 销 与 符 
号 表 大 小 的 对 数 成 正比 。 这 个 事实 意味 着 针对 第 一 次 get 请 求 ， 你 可 能 会 经 历 一 个 小 的 延迟 
(对 于 所 有 put 操作 都 会 有 这 个 延迟 )， 但 其 后 的 请 求 响应 速度 很 快 。 
索引 。Index (程序 4.4.2 ) 是 一 个 典型 的 符号 表 客 户 程序 ， 它 交 蔡 地 调用 了 一 系列 get() 
和 putO : 程序 从 标准 输入 中 读 取 一 个 字符 串 序列 ， 并 打印 出 一 个 排 好 序 的 字符 串 表 ， 每 个 字 
符 串 对 应 一 个 整数 列表 ， 用 于 指示 字符 串 在 输入 中 的 位 置 。 我 们 有 大 量 的 数据 ， 并 和 希望 知道 
某 些 感 兴趣 的 字符 串 在 哪里 出 现 。 在 这 种 情况 下 ， 我 们 似乎 是 将 多 个 值 与 一 个 键 相 关联 (因为 
一 个 词 可 能 多 次 出 现 一 一 译 者 注 )， 但 实际 上 只 关联 了 一 个 值 : 因为 我 们 把 这 些 值 存 人 了 一 个 
队列 。Index 使 用 两 个 整数 型 命令 行 参 数 来 控制 输出 : 第 一 个 整数 是 符号 表 中 最 小 字符 串 的 长 
度 ， 第 二 个 是 被 打印 的 字符 串 的 最 少 出 现 次 数 。 以 下 列 出 了 Index 程序 在 不 同 领域 中 的 应 用 。 
。 图 书 索引 。 每 本 教科 书 都 有 一 个 索引 ， 可 以 用 于 查找 一 个 单词 并 获取 包含 该 单词 的 页 
码 。 虽 然 没 有 读者 希望 书 中 的 每 一 个 单词 都 包括 在 索引 中 ， 类 似 Index 这 样 的 程序 可 
以 帮助 我 们 创建 一 个 优质 的 索引 (因为 Index 程序 可 以 选择 将 出 现 频 度 较 高 的 词 列 出 
来 一 一 译 者 注 )。 
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程序 4.4.2 索引 





public class Index 
public static void main(String[] args) 


int minlen = Integer.parseInt(args[0]); 
int minocc = Integer.parseInt(args[1]); 
// 创建 并 初始 化 符号 表 

ST<String, Queue<Integer>> st; 

st = new ST<String, Queue<Integer>>QO); jminlen | 最 短 长 度 
-i (int i = 0; !StdIn.isEmpty(); i++) | minocc | 计数 闹 值 


String word = StdIn.readString(); | st 了 | 符号 表 
if (word.length() < minlen) continue; “ word | 当前 单 语 
if 〈!st.contains(word)) | 当前 单词 

st.put(word, new Queue<Integer>()); 
Queue<Integer> queue = st.get(word); 
queue .enqueue(i); 


} 


/ 输出 出 现 次 数 超过 阅 值 的 单词 
for (String : st) 
{ 








Queue<Integer> queue = st.get(s); 
if (queue.size() >= minocc) 
StdOut.printin(s + ": " + queue); 






”这 个 符号 表 的 客户 程序 为 一 个 文本 文件 建立 一 个 索引 ， 刍 是 单词 ， 值 是 
文件 中 单词 出 现 的 位 置 的 队列 。 


% java Index 9 30 < TaleOfTwoCities.txt 
confidence: 2794 23064 25031 34249 47907 48268 48577 ... 
courtyard: 11885 12062 17303 17451 32404 32522 38663 ... 
evremonde: 86211 90791 90798 90802 90814 90822 90856 ... 





something: 3406 3765 9283 13234 13239 15245 20257 ... 
sometimes: 4514 4530 4548 6082 20731 33883 34239 ... 
vengeance: 56041 63943 67705 79351 79941 79945 80225 ... 






| queue 当前 单词 的 位 置 队列 



















。 编程 语言 。 在 大 型 程序 中 往往 会 使 用 大 量 的 符号 (变量 名 或 函数 名 )， 了 人 解 每 个 名 称 
的 使 用 位 置 是 非常 有 必要 的 。 类 似 Index 的 程序 可 以 发 挥 非常 重要 的 作用 ， 帮 助 程序 
员 跟 踪 程 序 中 符号 的 使 用 位 置 。 历 史上 ， 打 印 出 一 个 符号 表 是 程序 员 用 来 管理 大 型 程 
序 的 最 重要 的 工具 之 一 。 在 现代 编程 语言 中 ， 符 号 表 是 编程 人 员 用 于 管理 系统 中 模块 


名 称 的 软件 工具 的 基础 。 
键 值 
书籍 索引 单词 页 码 
基因 组 学 DNA 序 列 基因 组 中 的 位 置 
网 络 搜索 关键 词 网 站 列表 
业务 信息 客户 姓名 交易 信息 
典型 的 索引 应 用 程序 


。 基因 组 学 。 在 一 个 典型 的 (可 能 有 点 过 于 简化 ) 基因 组 学 研究 场景 中 ， 


一 个 科学 家 往往 


希望 知道 一 个 给 定 的 基因 序列 在 一 个 现 有 的 基因 组 或 基因 组 集中 的 位 置 。 某 些 序列 是 
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否 存在 或 者 与 哪些 序列 邻近 ， 可 能 都 具有 重要 的 科学 意义 。 这 类 科学 研究 的 起 点 是 类 
似 于 程序 mdex 产生 的 索引 ， 需 要 做 的 修改 是 ， 要 考虑 到 基因 组 不 会 被 分 割 成 “单词 ”。 
。 网 络 搜索 。 当 你 键 人 一 个 关键 字 ， 获 取 包 含 该 关键 字 的 网 站 列表 时 ， 你 就 在 使 用 Web 
搜索 引擎 创建 的 索引 ， 在 这 个 索引 中 ， 值 是 网 页 的 列表 ， 键 是 查询 的 单词 。 当 然 实际 
情况 会 更 加 动态 和 复杂 ， 因 为 我 们 经 常 指定 多 个 键 ， 并 且 页 面 遍 布 整个 网 络 ， 而 不 是 


保存 在 单个 计算 机 中 。 


。 账户 信息 。 如 果 一 个 公司 想 为 客户 账户 记录 客户 一 天 的 交易 信息 ， 一 种 方法 就 是 保存 
交易 列表 的 索引 。 键 为 账号 ; 值 是 在 交易 列表 中 该 账号 出 现 的 列表 。 


我 们 特别 希望 你 能 从 本 书 官网 下 载 程序 mdex， 并 使 用 不 同 的 输入 文件 


= A 


运行 程序 ， 


以 便 


进一步 了 解 符号 表 的 应 用 。 如 果 你 这 样 做 ， 你 会 发 现 这 个 程序 可 以 在 短 时 间 内 为 大 型 文件 构 
建 大 型 索引 ， 而 且 每 个 put 操作 和 get 请 求 都 能 立即 响应 。 为 大 型 的 符号 表 提 供 快速 响应 是 


算法 技术 的 经 典 贡 献 之 一 。 

基本 的 符号 表 实 现 上 述 所 有 的 例子 都 是 符号 表 
重要 性 的 有 力 证 据 。 符 号 表 的 实现 已 经 被 深入 研究 ， 
为 此 设计 了 许多 不 同 的 算法 和 数据 结构 。 现 代 编 程 环 
境 (如 Java) 往往 会 包括 一 个 (或 更 多 ) 符号 表 实 现 。 
按照 惯例 ， 了 解 一 个 最 基础 的 符号 表 的 工作 原理 将 帮 
助 你 理解 那些 高 级 的 实现 ,并 能 更 好 地 选择 和 更 有 效 
地 使 用 它们 ， 同 时 也 能 帮助 你 在 必要 时 设计 自己 的 符 
号 表 实现 〈 用 于 解决 一 些 特定 场景 的 专用 问题 )。 

首先 ， 我 们 简单 讨论 两 个 基本 实现 ， 基 于 我 们 使 
用 过 的 两 种 基本 数据 结构 : 可 变数 组 和 链表 。 我 们 这 样 
做 的 目的 是 为 了 让 你 明白 : 我 们 需要 一 个 更 为 复杂 的 数 
据 结构 ， 因 为 每 个 实现 的 put 操作 和 get 操作 都 需要 线 
性 运行 时 间 ， 这 使 得 它们 都 不 适合 大 型 的 实用 程序 。 

也 许 最 简单 的 实现 是 将 键 - 值 对 存储 在 一 个 无 序 
的 链表 (或 数组 ) 中 ,使 用 顺序 搜索 (sequential search ) 
(参见 练习 4.4.6 ) 来 查找 数据 。 顺 序 搜索 意味 着 在 搜索 
键 时 ， 会 依次 检查 每 个 节点 (或 元 素 )， 直 到 找到 指定 
的 键 或 遍历 完整 个 链表 (或 数组 )。 这 种 实现 方式 对 于 
典型 的 客户 程序 来 说 是 不 可 行 的 ， 因 为 当 键 不 在 符号 
表 中 时 get 操作 花费 了 线性 时 间 。 

或 者 ， 我 们 可 以 使 用 键 的 排序 (可 变 ) 数组 和 值 的 
平行 数组 (平行 数组 是 指 键 和 值 各 占 一 个 数组 ， 配 对 的 
键 和 值 的 下 标 是 一 致 的 一 一 译 者 注 )。 由 于 键 是 已 经 排 
好 序 的 ， 因 此 我 们 可 以 使 用 二 分 查找 实现 键 (及 关联 
值 ) 的 搜索 ， 如 4.2 节 所 述 。 基 于 二 分 查找 法 实现 一 个 
符号 表 并 不 困难 (具体 参见 练习 4.4.5 )。 这 种 实现 中 ， 








fe 


大 于 CAT 的 键 


都 需要 移动 


将 CAT 插 入 排 


GAG 一 好 序 的 数组 中 


在 一 个 有 序 的 数组 中 插入 数据 需要 线性 时 间 


查找 是 快速 的 (对 数 运 行 时 间 )， 但 是 插 和 人 通常 很 慢 〈 线 性 运行 时 间 )， 因 为 必须 按照 键 的 排 
序 顺序 维护 一 个 可 变数 组 。 每 次 插入 一 个 新 的 键 时 ， 所 有 大 的 键 必须 在 数组 中 后 移 一 个 位 
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置 ， 这 意味 着 在 最 坏 的 情况 下 put 操作 需要 线性 运行 时 间 。 


需要 遍历 整 条 
be 链 才能 知道 一 个 


二 键 不 存在 
链表 中 的 顺序 搜索 需要 线性 运行 时 间 


为 了 实现 一 个 适用 于 Lookup 和 Index 的 符号 表 ， 我 们 需要 一 个 比 链表 或 可 变数 组 更 灵 
活 的 数据 结构 。 接 下 来 ， 我 们 将 讨论 两 种 这 样 的 数据 结构 ; 散 列 表 和 一 又 搜索 树 。 

散 列表 散 列表 是 一 种 数据 结构 ， 它 把 刍 分 成 小 的 组 ， 可 以 实现 快速 查找 。 我 们 选择 一 
个 参数 m， 把 所 有 键 分 成 组 ， 期 望 组 的 大 小 大 至 相同 。 在 每 个 组 内 部 ， 我 们 使 用 未 排序 
的 列表 保存 键 并 使 用 顺序 查找 算法 ， 就 像 前 文 讨论 的 基本 实现 方法 。 

为 了 实现 把 键 划分 为 m 个 组 ， 我 们 使 用 一 个 称 为 
列 数 (hash function) 的 函数 。 散 列 本 数 将 每 个 刍 映 射 。 一 0 一 一 J 一 
为 一 个 散 列 值 一 一 个 位 于 0 到 m-1 之 间 的 整数 。 这 使 。 T03333 





[a 


3 
得 我 们 可 以 把 符号 表 建 模 为 一 个 长 度 固定 的 数组 ,其 元 。 Cc jo03ys 8 
素 为 链表 ， 并 使 用 散 列 值 作为 数组 索引 下 标 来 访问 所 需 。 Ci 703 
的 链表 。 2 AAA 64545 0 
散 列 算法 非常 有 用 ， 所 以 很 多 编程 语言 都 提供 了 对 。 7 6466 
它 的 直接 支持 。 正 如 3.3 节 所 述 ， 每 个 Java 类 都 应 该 有 cei7a 
一 个 hashCode() 方法 正 是 为 了 用 于 此 目的 。 如 果 你 使 用 
的 是 非 标准 类 型 ， 则 需要 检查 hashCode() 是 否 被 正确 实 “7 
现 ， 因 为 默认 情况 下 可 能 无 法 将 键 划分 为 相同 大 小 的 组 。 '""” 341? E 
为 了 将 散 列 码 转换 为 0 到 m-1 之 间 的 散 列 值 , 我 们 使 用 ATrC 65140 : 
表达 式 Math.abs (x.hashCode()%m ) 。 ea 如 站 大 
1 


只 要 两 个 对 象 相等 (通过 equals() 方 法 判断 )， 它 演 A 
们 就 具有 相同 的 散 列 码 。 但 是 ， 不 相等 的 对 象 其 散 列 码 于 
也 可 能 相同 。 最 后 设计 散 列 函数 时 ， 应 该 尽量 使 得 调用 
Math.abs (x.hashCode()%m) 时 以 相等 的 概率 从 0 到 m-1 之 间 取 值 。 

上 面 的 表格 是 12 个 具有 代表 性 的 字符 串 键 的 散 列 码 和 散 列 值 ， 其 中 m=5。 注 意 : 一 般 
来 说 ， 散 列 码 为 在 -22 和 23-1 之 间 的 整数 ， 对 于 较 短 的 字母 数字 字符 串 ， 散 列 码 也 会 是 较 
小 的 正 整数 。 

通过 上 述 准备 工作 ， 使 用 散 列 算法 直接 扩展 4.3 节 中 讨论 的 链表 代码 ， 就 可 以 实现 一 个 
高 效 的 符号 表 。 我 们 维护 一 个 由 m 个 链表 组 成 的 数组 ， 其 中 数组 元 素 i 是 一 个 包含 所 有 散 列 
值 为 i 的 键 (连同 其 关联 值 ) 的 链表 。 当 定位 一 个 键 时 : 

。 计 算 其 散 列 值 以 定位 其 链表 。 

。 和 迭代 该 链表 中 的 节点 ， 查 找 该 键 。 

。 如果 定位 键 在 链表 中 ， 则 返回 键 的 关联 值 ， 否则 ， 返 回 null。 

当 想 要 插入 一 个 键 - 值 对 时 : 

。 计 算 键 的 散 列 值 以 定位 其 链表 。 

。 和 迭代 该 链表 中 的 节点 ， 查 找 该 键 。 
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。 如 果 键 在 链表 中 ， 则 将 当前 与 键 关联 的 值 替 换 为 新 值 ; 和 否则， 使 用 给 定 的 键 和 值 创建 
一 个 新 节点 ， 并 将 其 插入 链表 的 开头 。 
HashSET (程序 4.4.3 ) 是 一 个 完整 的 实现 ,使 用 固定 数量 (m=1024 ) 的 链表 。 它 依赖 
于 以 下 髋 套 类 来 表示 链表 中 的 每 个 节点 : 


private static class Node 
{ 
private Object key; 
private Object val; 
private Node next; 


public Node(Object key, Object val, Node next) 
{ 
this.key = key; 
this.val = val; 
this.next = next; 
} 
} 


程序 HashST 的 效率 取决 于 m 的 值 和 散 列 函数 的 好 坏 。 假 设 散 列 函 数 可 以 合理 地 分 配 
键 ， 则 程序 性 能 比 链表 中 的 顺序 查找 快 约 m 倍 ;其 代价 是 m 个 额外 的 引用 和 和 链表。 这 是 一 
个 经 典 的 时 空 折 中 方案 : m 的 值 越 大 ， 使 用 的 内 存 就 越 多 ， 但 消耗 的 时 间 越 少 。 637 


程序 4.4.3” 散 列表 


public class HashST<Key, Value> 
{ 


private int m = 1024; 

private Node[] lists = new Node[m]; 链表 的 数量 
private class Node 1ists[i] | 散 列 值 的 链表 
{ 大 见 对 应 正文 内 容 闻 } 


private int hash(Key key) 
{ return Math.abs(key.hashCode() % m); } 


public Value get(Key key) 
{ 


int i = hash(key); 
for (Node x = lists[i]; x != null; x = x.next) 
if (key.equals(x.key)) 
return (Value) x.val; 
return null; 


public void put(Key key, Value val) 
{ 


int 1 = hash(key); 
for (Node x = lists[i]; x != null; x = x.next) 


if (key.equals(x.key)) 
{ 


x.val = val; 
return; 


lists[i] = new Node(key, val, lists[i]); 


这 个 程序 使 用 一 个 链表 来 实现 散 列表 。 散 列 函 数 选 择 m 个 链表 中 的 一 个 。 
如 果 表 中 存在 x 个 键 ， 则 对 于 合适 的 hashCode0 实 现 ，put0 或 get0 操 作 的 平均 
代价 为 n / m。 如 果 我 们 使 用 一 个 可 变数 组 来 保证 每 个 链表 中 键 的 平均 数量 在 
1] 和 8 之 间 (参见 练习 4.4.12 ) ， 则 每 次 操作 的 运行 时 间 为 常量 。 我 们 把 contains0、 
keys() 、size() 和 remove() 留 到 练习 4.4.8 ~ 4.4.11 来 实现 。 
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下 图 显示 了 为 示例 中 的 键 所 构建 的 散 列 表 (按照 前 文 表格 所 给 的 顺序 插 人 )。 首 先 ， 
GGT 被 插入 链表 1， 然 后 TTA 被 插入 链表 3， 然后 GCC 被 插入 链表 0 中 ， 以 此 类 推 。 散 列 
表 构 建 完 之 后 开始 查找 CAG ， 通 过 计算 CAG 的 散 列 值 (计算 结果 为 2 )， 然 后 顺序 地 查找 链 
表 2。 在 找到 链表 2 的 第 二 个 节点 中 的 键 CAG 之 后 ， 方 法 get() 返回 值 Glutamine。 


rel wernionine [EL tysine [EL Manine T°] 
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链表 都 很 小 


WO 


lists[] 


A] soneueine | 
殉 三 5 时 的 散 列表 


通常 情况 下 ， 程 序 员 通 过 大 致 估计 要 处 理 的 键 的 数量 ， 来 选择 一 个 大 的 固定 值 m ( 例 
如 ， 默 认 情 况 下 我 们 选择 1024 )。 通 过 使 用 可 变数 组 lists[]， 我 们 可 以 确保 每 个 链表 的 平 
均 键 数 是 常量 。 例 如 ， 练 习 4.4.12 展示 了 如 何 确 保 每 个 链表 的 平均 键 数 在 1 和 8 之 间 ， 从 
而 使 得 put 和 get 操作 的 运行 性 能 均 为 常量 。 肯 定 需 要 调整 这 些 参数 来 更 好 地 适应 实际 应 用 
场景 。 

散 列表 的 主要 优点 是 它们 可 以 高 效 地 完成 put 和 get 操作 。 散 列表 的 一 个 缺点 是 它们 没 
有 利用 键 的 顺序 ， 从 而 不 能 保证 键 按 顺序 排列 (或 无 法 支持 基于 排序 的 其 他 操作 )。 例 如 ， 
如 果 在 Index 中 用 HashST 替换 ST， 那 么 这 些 键 可 能 会 以 杂乱 的 顺序 输出 ， 而 不 是 按照 顺 
序 。 或者， 如 果 想 找到 最 小 的 键 或 最 大 的 键 ， 我 们 必须 查找 全 部 的 键 。 接 下 来 ， 我 们 讨论 
另 一 个 符号 表 实现 ， 在 键 可 比较 的 情况 下 支持 基于 顺序 的 操作 ， 而 无 须 御 牲 put( 和 get() 
的 性 能 。 

二 叉 搜索 树 ”二 又 树 是 一 种 数学 抽象 ， 在 高 效 的 信息 组 织 中 扮演 重要 的 角色 。 二 叉 树 是 
一 个 递归 定义 的 结构 ， 可 以 是 如 下 类 型 : 空 树 ( null), 或 者 是 一 个 节点 包含 着 到 两 个 不 相交 
的 二 叉 树 的 链接 。 二 叉 树 在 计算 机 编程 中 起 着 重要 的 作用 ， 因 为 它 提供 了 实现 的 灵活 性 和 方 
便 性 之 间 的 有 效 平衡 。 二 叉 树 在 科学 、 数 学 和 计算 方面 有 很 多 应 用 ， 你 肯定 会 在 很 多 场合 遇 
到 这 个 模型 。 

讨论 二 叉 树 时 ， 我 们 通常 使 用 基于 树 的 术语 。 我 们 把 根 节点 
位 于 顶部 的 节点 称 为 树 的 根 ， 左 链接 引用 的 节点 称 为 左 子 
树 ， 右 链接 引用 的 节点 称 为 右 子 树 。 按 传统 ， 计 算 机 科学 
家 将 树 倒 置 ， 顶 端 是 根 。 左 右 链接 均 为 null 的 节点 称 为 叶 
子 节点 。 树 的 高 度 是 从 根 节点 到 叶 节 点 的 所 有 路 径 中 节点 
最 多 的 那 条 路 径 的 链接 数 。 

与 数组 、 链 表 和 散 列 表 一 样 ， 我 们 使 用 二 叉 树 来 存储 eid 
数据 的 集合 。 对 于 符号 表 的 实现 ， 我 们 使 用 一 种 称 为 二 又 一 棵 一 玉树 的 剖析 图 
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搜索 树 (BST) 的 特殊 类 型 的 二 叉 树 。 二 又 搜索 树 是 一 个 二 叉 树 ， 每 个 节点 包含 一 个 键 值 对 ， 
并 且 键 有 如 下 对 称 顺 序 : 每 个 节点 的 键 大 于 其 左 子 树 中 每 大 二 二 
个 节点 的 键 ， 并 小 于 其 右 子 树 中 每 个 节点 的 键 。 下 面 你 将 。 较 小 的 刍 mE 
看 到 ， 对 称 排序 能 够 高 效 地 实现 put 和 get 操作 。 < © 
为 了 实现 二 叉 搜 索 树 ， 我 们 从 节点 抽象 的 类 开始 ， 它 
包括 四 个 引用 ,分 别 指向 键 、 值 、 左 二 又 搜索 树 和 右 二 又 
搜索 树 。 键 类 型 必须 实现 Comparable( 用 于 指定 键 的 顺序 )， 
但 值 类 型 是 任意 的 。 对 称 顺序 


class Node 







Key key; 
Value val; 
Node left, right; 


这 个 定义 类 似 于 我 们 对 链表 节点 的 定义 ， 
除了 它 包含 两 个 链接 ， 而 不 是 一 个 链接 。 与 链 
表 一 样 ， 递 归 数 据 结构 的 思想 可 能 有 些 费 解 ， 
但 其 实 我 们 所 做 的 只 是 在 链表 的 定义 中 添加 了 
第 二 个 链接 (并 加 入 排序 )。 

为 了 (稍微 ) 简化 代码 ， 我 们 在 Node 中 添 A NN 
加 了 一 个 构造 函数 ， 用 于 初始 化 key 和 val 实例 AZ 具有 较 小 锰 的 BST 具有 较 大 键 的 BSTAN、 
变量 : 二 叉 搜 索 树 的 示意 图 

Mee key, Value val) 





left right 





this.key = key; 
this.val = val; 


new Node(key，val) 的 结果 是 一 个 指向 Node 对 象 的 引用 (我们 可 以 将 其 赋值 给 Node 
类 型 的 任何 变量 )， 其 key 和 val 实例 变量 被 设置 为 给 定 的 值 ， 其 left 和 right 实例 变量 均 初 
始 化 为 null。 

与 链表 一 样 ， 当 跟踪 使 用 二 又 搜索 树 的 代码 时 ， 我 们 可 以 使 用 一 种 可 视 化 表示 方式 : 

。 绘制 一 个 矩形 框 来 表示 每 个 对 象 。 

。 将 实例 变量 放 在 矩形 框 中 。 

。 绘制 箭头 指向 引用 的 对 象 。 

在 大 多 数 情况 下 ， 我 们 使 用 一 种 更 简单 的 抽象 表示 ,绘制 包含 键 的 矩形 框 (或 圆 形 ) 表示 
节点 (省 略 值 )， 使 用 箭头 连接 节点 以 表示 链接 。 这 个 抽象 表示 使 我 们 能 够 主要 关注 链接 结构 。 

下 面 给 出 一 个 例子 ， 我 们 考虑 一 个 带 有 字符 串 键 和 整数 值 的 二 又 搜索 树 。 要 构建 一 个 将 
值 0 与 键 “it” 关 联 的 单 节点 的 二 又 搜索 树 ， 我 们 创建 一 个 Node: 


Node first = new Node("it", 0); 


由 于 左右 链接 均 为 null， 所 以 该 节点 表示 含有 一 个 节点 的 二 叉 搜索 树 。 要 添加 将 值 1 与 键 相 
关联 的 节点 ， 我 们 创建 另 一 个 节点 : 


Node second = new Node("was", 1); 
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(这 本 身 就 是 一 个 二 又 搜 索 树 ) 并 将 第 一 个 Node 的 右 字段 链接 到 此 节点 : 


first.right = second; 


第 二 个 节点 必须 位 于 第 一 个 节点 的 右 侧 ， 因 为 “ it 
比 “ was” 的 字母 顺序 小 (或 者 ， 我 们 可 以 设置 second.left 
为 first)。 现 在 我 们 可 以 添加 第 三 个 节点 ， 把 键 “ the” 与 
值 2 关联 : 


Node third = new Node("the", 2); 
second.left = third; 


再 使 用 如 下 代码 把 第 四 个 键 “best” 与 值 3 相关 联 : 


Node fourth = new Node("best", 3); 
first.left = fourth; 


请 注意 ， 根 据 定义 ， 每 个 链接 ( first、second 、third 
和 fourth) 都 是 二 又 搜索 树 〈 每 个 链接 或 者 为 null 或 者 引用 
二 叉 搜 索 树 ， 并 且 在 每 个 节点 上 都 满足 排序 条 件 )。 

在 目前 的 情况 下 ,注意 确保 总 是 将 节点 连接 在 一 起 ， 
并 且 能 够 使 得 我 们 创建 的 每 个 节点 都 是 二 又 搜索 树 的 根 
(有 一 个 键 ， 一 个 值 ， 左 侧 链接 到 一 个 较 小 值 的 二 叉 搜索 
树 ， 右 侧 链 接 到 一 个 较 大 值 的 二 又 搜索 树 )。 从 二 又 搜 索 树 
数据 结构 的 角度 来 看 ， 值 并 不 重要 ， 所 以 我 们 在 图 中 经 常 
忽略 它 ， 但 是 我 们 把 它 包含 在 定义 中 ， 因 为 它 在 符号 表 概 
念 中 扮演 着 重要 的 角色 。 我 们 稍微 滥用 了 命名 法 ,使 用 ST 
同时 来 表示 “符号 表 ” 和 “搜索 树 ”， 因 为 搜索 树 在 符号 表 
实现 中 扮演 着 如 此 重要 的 角色 。 

一 个 二 又 搜 索 树 代表 了 一 个 有 序 的 项 序列 。 在 刚刚 讨 


Node first = new Node("it", 0); 





Node second = new Node("was", 1); 
first.right = second; 





Node third= new Node("the”", 2); 
second.left = third; 





Node fourth = new Node("best", 2); 
first.left = fourth; 





将 二 叉 搜索 树 连接 在 一 起 


论 的 例子 中 ，first 代表 序列 “best it the was”。 我 们 也 可 以 使 用 数组 来 表示 一 个 有 序 序列 。 


例如 ， 我 们 可 以 使 用 
String[] a = { "best", "it", "the", "was"” }; 


表示 与 上 述 相同 的 有 序 字 符 串 序 列 。 给 定 一 个 不 同 键 的 
集合 ， 存 在 唯一 的 方法 把 集合 表示 为 一 个 有 序数 组 ， 但 
是 存在 许多 方法 把 集合 表示 成 一 个 二 又 搜 索 树 (具体 参 
见 练习 4.4.7 )。 这 种 灵活 性 允许 我 们 开发 高 效 的 符号 表 
实现 。 例 如 ， 在 我 们 的 例子 中 ,通过 创建 一 个 新 节点 
并 且 仅 修改 一 个 链接 就 可 以 插入 新 的 键 值 对 。 可 以 证 
明 ， 只 改动 一 个 链接 就 可 以 处 理 所 有 的 情况 。 同 样 重要 
的 是 ,我 们 可 以 很 容易 地 在 树 中 找到 一 个 指定 的 键 所 在 
的 位 置 ， 也 可 以 找到 用 于 增加 一 个 新 键 所 需要 改动 的 链 
接 的 位 置 。 接 下 来 ,我 们 讨论 实现 上 述 任务 的 符号 表 
代码 。 


3 
; ; the : 
2 1 





CE Ee || the Es was 
表示 同一 序列 的 两 个 不 同 的 二 又 搜索 树 
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搜索 。 假 设 需要 在 二 又 搜索 树 中 查找 具有 给 定 键 的 节点 (或 者 在 一 个 符号 表 中 调用 get 获取 
给 定 键 的 值 )。 存 在 两 种 可 能 的 结果 : 搜索 成 功 ( 在 二 叉 搜索 树 中 找到 键 ; 在 符号 表 实 现 中 ,我 
们 返回 关联 的 值 ) 或 者 搜索 失败 (二 叉 搜 索 树 不 存在 给 定 的 键 ; 在 符号 表 实现 中 我 们 返回 null)。 





在 三 又 搜索 树 中 在 二 又 搜索 树 中 
成 功 搜 索 到 能 为 没有 失 索 到 刍 为 
“the” 的 节点 “times” 的 节点 
| times 比 大， 所 以 
-- 一 递归 搜索 厂子 树 
[best fo fe 所 以 | 
递归 搜索 右 子 树 the 
-Da 
2 times 比 was 小 ， 
the 比 was 小 ， 所 Lb 所 以 递归 搜索 
LE 
[was] [was] 
于 二 times 比 the 大 ， 但 是 
of | 功 搜 索 到 “the” a 
“times" 的 节点 
二 叉 搜索 树 搜索 示意 图 
显而易见 比较 合理 的 实现 方式 是 采用 递 “ 下、 mes 
人 一 a 和 imes 比 it 大 ， 所 以 
归 搜索 算法 : 给 定 一 个 二 又 搜索 树 (指向 一 个 写生 
Node 的 引用 )， 首 先 检 查 树 是 否 为 空 ( 即 引用 是 
否 为 null)， 如 果树 为 空 ， 则 结束 搜索 ， 提 示 不 T 
成 功 (在 符号 表 实 现 中 返回 null) ; 如 果树 不 为 
空 ， 检 查 节 点 中 的 键 是 否 等 于 搜索 的 键 ， 如 果 
相等 ， 则 结束 搜索 ， 提 示 成 功 (在 符号 表 实 现 全 二 
中 返回 与 该 键 相 关联 的 值 ) ， 如 果 不 是 ， 则 将 搜 二 timestbwas 小 ， 所 以 
索 的 键 与 节点 中 的 键 进行 比较 ， 如 果 较 小 ， 则 i NS 
在 左 子 树 中 搜索 (递归 ) ; 如 果 较 大 ， 则 在 右 子 
树 中 搜索 (递归 )。 
从 递归 角度 上 和 看， 证明 这 个 方法 的 可 行 性 [esel Wi 
和 正确 性 并 不 困难 ， 基 于 “如 果 在 二 叉 搜 索 树 i 
中 存在 ， 当 且 仅 当 该 键 在 当前 子 树 中 ”的 不 变 以 插入 右 子 树 
原则 。 递 归 方 法 的 关键 特性 是 我 们 永远 只 须 检 一 
查 一 个 节点 以 确定 下 一 步 采 取 何 种 行动 。 此 外 ， 
我 们 通常 仅仅 检查 树 中 的 少 部 分 节点 : 因为 无 
论 何 时 我 们 进入 一 个 节点 的 子 树 ， 我 们 就 永远 
不 会 检查 该 节点 另 一 个 子 树 中 的 节点 。 


插入 。 假 设 我 们 需要 插入 一 个 新 的 节点 到 将 一 个 新 节点 插入 二 叉 搜索 树 
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一 个 二 又 搜索 树 中 (在 符号 表 实现 中 ， 对 应 于 使 用 put 操作 把 一 个 新 的 键 - 值 对 放 和 数据 结 
构 中 )， 其 逻辑 类 似 于 搜索 一 个 键 ， 但 是 实现 稍微 复杂 。 理 解 插入 操作 的 关键 是 要 认识 到 仅 
仅 需 要 修改 一 个 链接 以 指向 新 节点 ， 而 这 个 链接 恰恰 ” 吉 志 到 


是 搜索 该 键 失败 时 查找 结果 为 null 的 链接 。 

如 果树 是 空 的 ， 则 创建 并 返回 一 个 包含 键 - 值 对 
的 新 节点 ; 如 果 搜 索 键 小 于 根 的 键 ， 则 设置 左 链 接 为 
插入 键 - 值 对 到 左 树 的 结果 ; 如 果 搜 索 键 较 大 ， 则 设 
置 右 链接 为 插入 键 - 值 对 到 右 树 的 结果 ; 其 他 情况 ， 
如 果 搜 索 键 与 根 的 键 相等 ， 则 将 当前 的 值 更 新 为 新 的 
值 。 以 这 种 方式 递归 调用 后 ， 重 置 左 链接 或 右 链接 是 
不 必要 的 ， 因 为 只 有 子 树 为 空 时 才 会 修改 链接 ， 虽然 
重 置 链接 很 容易 做 到 ， 但 我 们 会 通过 检查 以 尽量 避免 
这 个 操作 。 

实现 。BST (程序 4.4.4 ) 是 一 个 基于 两 个 递归 
算法 的 符号 表 实 现 。 如 果 将 此 代码 与 二 分 查找 实现 
BinarySearch (程序 4.2.3 ) 以 及 栈 和 队列 实现 Stack 
(程序 4.3.4) Queue (程序 4.3.6 ) 进行 比较 ， 你 将 会 
发 现 此 代码 更 加 优雅 和 易 读 。 请 花 些 时 间 仔 细 思 考 递 
归 ， 以 确保 你 能 正确 理解 这 段 代 码 。 也 许 最 简单 的 方 
法 是 跟踪 并 观察 根据 一 系列 样本 键 构造 一 棵 二 又 搜索 
树 的 过 程 。 这 可 以 算是 一 个 对 基本 数据 结构 的 理解 程 
度 的 测试 。 

此 外 ，BST 中 的 put0 和 get0 方 法 效率 非常 高 : 
通常 ， 每 个 方法 仅仅 访问 二 又 搜索 树 中 的 少量 节点 
(从 根 节 点 到 搜索 到 的 节点 ， 或 者 替换 为 连接 到 新 节 
点 的 null 链接 )。 接 下 来 ， 我 们 将 证 明 put 操作 和 get 
请 求 仅 会 消耗 对 数 运 行 时 间 (在 某 些 假设 下 )。 另 外 ， 
put() 只 创建 一 个 新 的 节点 并 添加 一 个 新 的 链接 。 如 
果 你 通过 插入 一 些 键 到 初始 的 空 树 来 构建 二 又 搜索 
树 ， 你 肯定 会 确信 
底部 绘制 一 个 新 的 节点 。 

二 又 搜索 树 的 性 能 特征 ”二 又 搜索 树 算法 的 运行 
时 间 最 终 取决 于 树 的 形状 ， 而 树 的 形状 取决 于 键 的 插 





搜索 树 中 的 键 


best 








WW 


i 
构建 一 个 BST 











入 顺序 。 理 解 这 种 依赖 关系 是 在 实际 情况 中 有 效 使 用 二 又 搜 索 树 的 关键 因素 。 


最 佳 情况 。 对 于 最 佳 情 况 ， 


二 又 搜索 树 是 一 棵 完全 平衡 的 树 〈 每 个 节点 恰好 包含 两 个 非 


空 的 子 节点 )， 根 节点 到 叶子 节点 的 节点 数 为 lgn。 在 这 样 的 树 中 ,很 容易 发 现 一 种 失败 搜索 
的 代价 为 对 数 型 ， 因 为 其 代价 满足 与 二 分 查找 算法 相同 的 递归 关系 式 (参见 4.2 节 )， 因 而 每 


个 put 操作 和 get 请 求 的 代价 正比 于 lgn 或 者 更 少 。 


这 在 实际 应 用 中 是 很 少见 的 ， 需 要 非常 


好 的 运气 才能 通过 逐一 插入 键 获得 一 棵 完全 平衡 的 树 ， 但 还 是 有 必要 了 解 BST 在 这 种 情况 


下 的 最 佳 性 能 特点 。 
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程序 4.4.4 二 又 搜 索 树 





public class BST<Key extends Comparable<Key>, Value> 


private Node root; root | BST 的 根 
private class Node 下 


Key key; 

Value val; Wd 键 
Node left, right; val 值 
Node(Key key, Value val) left | 左 子 树 
{ this.key = key; this.val = val; } right | 右 子 树 


public Value get(Key key) 
{ return get(root, key); } 


private Value get(Node x, Key key) 
{ 


if (x == null) return null; 

int cmp = key.compareTo(x.key); 

if (cmp < 0) return get(x.left, key); 
else if (cmp > 0) return get(x.right, key); 
else return x.val; 


} 


public void put(Key key; Value val) 
{ root = put(root, key, val); } 


private Node put(Node x, Key key, Value val) 
{ 


if (x == null1) return new Node(key, val); 

int cmp = key.compareTo(x.Kkey); 

if (cmp < 0) x.left = put(x.left, key, val); 
else if (cmp > 0) x.right = put(x.right, key, val); 
else x.val = val; 

return x; 


以 递归 BST 数 据 结构 为 中 心 的 符号 表 数 据 类 型 的 实现 、 使 用 递归 的 方法 实 
现 遍 历 。 我 们 将 contains(0) 、size0 和 remove0 的 实现 和 留 到 练习 4:4.18 ~ 4.4.20。 我 
们 在 本 节 结 尾 处 实现 了 Keys0: 





the 


最 佳 情 况 下 的 二 叉 搜索 树 (完全 平衡 树 ) 


一 般 情 况 。 如 果 按 照 随机 顺序 插入 键 ， 我 们 可 以 期 望 搜索 时 间 也 是 对 数 型 ， 因 为 第 一 个 
键 成 为 树 的 根 ， 其 他 键 会 大 致 分 成 两 部 分 。 对 于 子 树 也 会 有 同样 的 规律 ， 我 们 期 望 获得 与 最 
佳 情 况 相同 的 结果 。 事 实 上 ， 这 种 直觉 可 以 通过 仔细 分 析 得 到 证 明 : 一 个 经 典 的 数学 推导 表 
明 ， 在 根据 随机 顺序 键 构造 的 树 中 ， 其 put 和 get 操作 所 需 的 时 间 是 对 数 型 (请 参阅 本 书 网 
站 上 的 参考 资料 )。 更 确切 地 说 ， 在 根据 nn 的 随机 顺序 键 构造 的 树 中 ， 随 机 的 put 和 get 操作 
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期 望 的 键 比 较 次 数 为 ~2Inn。 在 实际 应 用 程序 中 ,例如 程序 Lookup， 当 我 们 可 以 控制 键 的 顺 
序 时 ， 我 们 会 刻意 地 使 键 值 随机 会 、 以 大 概率 保证 结果 的 对 数 型 性 能 。 事 实 上 ， 因 为 2lnn 
约 为 1.39lnn， 所 以 一 般 情况 只 比 最 佳 情况 大 约 多 出 39%。 在 Index 这 样 的 应 用 程序 中 ,我 
们 无 法 控制 插入 的 顺序 ,因此 不 能 保证 性 能 ， 但 典型 的 数据 仍然 可 以 达到 对 数 性 能 (具体 参 
见 练习 4.4.26 )。 与 二 分 查找 一 样 ， 这 个 事实 十 分 重要 ， 因 为 对 数 级 和 线性 算法 性 能 差异 巨 
大 : 使 用 基于 二 又 搜索 树 的 符号 表 实 现 ， 即 使 针对 巨大 的 符号 表 ， 我 们 也 可 以 实现 每 秒 数 
百 万 次 操作 (或 更 多 )。 


me 


根据 随机 顺序 键 构造 出 的 典型 二 又 搜索 树 


最 坏 情况 。 在 最 坏 情 况 下 ， 每 个 节点 (除了 一 个 节点 ) 总 是 会 包含 一 个 空 链接 ， 因 而 二 
叉 搜 索 树 与 链表 相似 ， 附 带 一 个 无 用 的 链接 ， 其 中 put 操作 和 get 请 求 需要 线性 时 间 。 不 幸 
的 是 ， 这 种 最 糟糕 的 情况 在 实践 中 并 不 少见 。 例 如 ， 当 按 顺 序 插 入 键 时 就 会 产生 这 种 情况 。 

因此 ， 基 本 二 又 搜 索 树 实现 的 良好 性 能 取决 于 键 是 否 随机 ， 从 而 决定 树 是 不 是 会 包含 许 
多 长 的 路 径 。 如 果 无 法 保证 这 个 假设 是 合理 的 ， 则 不 要 使 用 简单 的 二 又 搜索 树 。 这 意味 着 ， 
很 可 能 当 问 题 规模 增加 时 相应 时 间 减 慢 (注意 : 在 软件 中 遇 到 这 种 情况 并 不 罕见 ! )。 令 人 欣 
喜 的 是 ， 存 在 其 他 二 又 搜索 树 的 变种 可 以 消除 最 坏 情况 ， 并 通过 构造 近乎 完全 平衡 的 树 以 保 
证 每 次 操作 的 对 数 时 间 性 能 。 一 个 流行 的 变种 称 为 红 黑 树 。 





最 坏 情况 下 的 二 叉 搜索 树 


遍历 二 叉 搜 索 树 ” 树 遍 历 (tree traversal) 也 许 是 树 的 最 基本 的 处 理 功能 : 给 定 一 棵 树 
(引用 )， 我 们 希望 系统 地 处 理 树 中 的 每 一 个 节点 。 对 于 链表 ， 我 们 通过 跟踪 从 一 个 节点 到 另 
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一 个 节点 的 单个 链接 来 完成 这 个 任务 。 但 是 对 于 二 又 树 ， 有 两 个 链接 可 以 选择 。 递 归 很 显然 
是 一 种 解决 方案 。 为 了 处 理 二 又 搜 索 树 中 的 所 有 键 ， 我 们 执行 如 下 步 又 : 


。 处 理 左 子 树 中 的 每 个 节点 。 
。 处 理 根 节点 。 
。 处 理 右 子 树 中 的 每 个 节点 。 


这 种 方法 称 为 树 的 中 序 遍 历 (inorder tree traversal)， 以 区 分 于 前 序 遍 历 ( 先 处 理 根 节点 ) 


和 后 序 遍 历 〈 最 后 处 理 根 节点 )。 这 些 树 遍 历 的 算法 经 常 出 现在 各 类 应 用 中 。 给 定 一 个 二 又 
搜索 树 ， 使 用 数学 归纳 法 可 以 很 容易 证 明 这 种 方法 不 仅 会 处 理 二 又 搜索 树 中 的 每 一 个 键 ， 而 
且 会 按照 键 的 顺序 依次 处 理 。 例 如 ， 如 下 方法 按照 从 小 到 大 的 顺序 输出 参数 指定 的 二 又 搜索 


树 中 的 所 有 键 : 
private void traverse(Node x) 


if (x == nul1) return; 
traverse(x.left); 
StdOut.printin(x.kKkey); 
traverse(x.right); 


证 


首先 ， 按 照 键 的 顺序 依次 输出 左 子 树 中 的 
所 有 键 。 接 着 输出 根 节点 。 然 后 按照 键 的 顺序 
输出 右 子 树 中 的 所 有 键 。 

这 种 非常 简单 的 方法 值得 仔细 研究 。 该 方 
法 可 以 作为 二 又 搜索 树 的 toString(0) 实现 的 基础 
(具体 参见 练习 4.4.21 )， 也 可 以 作为 keys() 方法 
实现 的 基础 ， 人 允许 客户 程序 使 用 Java foreach 按 
照排 序 顺序 循环 遍历 二 又 搜索 树 中 的 键 (回顾 一 
下 ， 这 个 功能 在 散 列 表 中 不 可 用 ， 因 为 没有 顺 
序 )。 接 下 来 我 们 讨论 这 个 遍历 的 基本 应 用 。 

和 迭代 键 。 仔 细 看 一 下 刚刚 讨论 的 递归 


traverse() 方 法 ， 它 提供 了 一 种 逐个 处 理 二 又 搜 索 树 数据 类 型 中 所 有 键 - 值 对 的 方法 。 简 单 
起 见 ， 我 们 只 迭代 键 ， 因 为 我 们 可 以 在 需要 的 时 候 获 得 键 关联 的 值 。 我 们 的 目标 是 实现 一 个 
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所 有 键 ， 书 排序 


二 叉 搜 索 树 的 中 序 递 归 人 遍历 


方法 keys()， 使 得 客户 程序 可 以 按照 下 面 的 方法 使 用 : 


BST<String, Double> st = new BST<String, Double>(); 


for (String key : st.keys(O)) 
StdOut.printin(key + " " + St.get(key)); 


Index (程序 4.4.2 ) 是 客户 程序 代码 的 另 一 个 例子 ， 它 使 用 foreach 循环 遍历 键 - 值 对 。 
实现 keys(0) 最 简单 的 方案 是 将 可 迭代 集合 中 的 所 有 键 收集 到 一 个 集合 中 《如 栈 或 队列 )， 


然后 将 可 迭代 的 结果 返回 给 客户 程序 。 
public Iterable<Key> keys() 
{ 
Queue<Key> queue = new Queue<Key>(); 


inorder(root, queue); 
return queue; 
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private void inorder(Node x, Queue<Key> queue) 


if (x == null) return; 
inorder(x.left, queue); 
queue.enqueue(x.key); 
inorder(x.right, queue); 

} 

当 你 第 一 次 看 到 树 遍历 的 代码 ， 一 定 会 觉得 十 分 神奇 。 有 序 迭 代 在 本 质 上 是 为 了 快速 搜 
索 和 快速 插入 而 设计 的 数据 结构 。 请 注意 ， 我 们 可 以 使 用 类 似 的 技术 〈 即 在 一 个 可 迭代 集合 
中 收集 键 ) 来 实现 HashST 的 keys() 方法 (具体 参阅 练习 4.4.10 )。 然 而 ， 这 种 实现 的 键 将 以 
任意 顺序 出 现 ， 因 为 散 列表 是 无 序 的 。 

有 序 符号 表 的 操作 ”二 又 搜索 树 的 灵活 性 和 键 可 比较 的 能 力 ， 使 得 我 们 能 比 散 列表 支持 
更 多 有 用 的 操作 。 基 于 二 又 搜 索 树 开发 了 许多 其 他 重要 的 操作 ,这 些 操 作 在 实际 中 有 广泛 的 
应 用 ， 下 面 的 清单 列 出 了 有 代表 性 的 一 部 分 。 我 们 把 这 些 操作 的 实现 留 作 练习 ， 并 将 进一步 
的 性 能 特征 研究 和 应 用 留 给 算法 和 数据 结构 课程 。 

最 小 值 和 最 大 值 。 为 了 获得 一 个 二 又 搜 索 树 中 的 最 小 键 ， 可 以 从 根 节点 开始 ， 跟 随 左 链 
接 直至 到 达 null。 遇 到 的 最 后 一 个 关键 字 是 二 又 搜索 树 中 最 小 的 。 按 照 同 样 的 过 程 ， 沿 着 右 
链接 就 可 以 找到 二 又 搜索 树 中 最 大 的 关键 字 ( 见 练习 4.4.27 ) 。 

大 小 和 子 树 大 小 。 为 了 跟踪 一 个 二 又 搜 索 树 的 节点 数量 ， 可 以 在 二 又 搜索 树 中 保存 一 个 
额外 的 实例 变量 an， 用 于 保存 树 的 节点 数量 。 把 n 初始 化 为 0， 每 当 创建 一 个 新 的 节点 ， 把 
n 增 加 1。 另外 ,在 每 个 节点 中 再 保存 一 个 额外 的 实例 变量 n， 用 于 计算 以 该 节点 为 根 节点 
的 子 树 中 节点 的 数量 (具体 参见 练习 4.4.29 ) 。 

范围 查找 和 范围 计数 。 使 用 类 似 于 inorder() 的 递归 方法 ， 可 以 返回 一 个 位 于 两 个 给 定 
值 之 间 键 的 迭代 器 ， 其 消耗 时 间 与 二 又 搜索 树 的 高 度 加 上 范围 中 键 的 数量 成 正比 (具体 参见 
练习 4.4.31 )。 如 果 我 们 在 每 个 节点 中 保存 一 个 实例 变量 以 存储 各 节点 为 根 的 子 树 的 大 小 ， 
我 们 就 可 以 统计 位 于 两 个 给 定 值 之 间 键 的 数量 ， 其 消耗 时 间 正 比 于 二 又 搜 索 树 的 高 度 (具体 
见 练习 4.4.31 )。 

层 序 统计 和 排 位 。 如 果 我 们 在 每 个 节点 中 保存 一 个 实例 变量 来 保存 各 节点 为 根 的 子 树 的 
大 小 ,我 们 可 以 实现 一 个 递归 方法 来 返回 第 k 个 最 小 键 ,其 消耗 时 间 与 三 又 搜索 树 的 高 度 成 
正比 (具体 参见 练习 4.4.55 ) 。 同 样 ， 我 们 可 以 计算 一 个 键 的 排 位 ， 以 表示 二 又 搜索 树 中 严 
格 小 于 该 键 的 键 的 数量 ( 见 练习 4.4.56 ) 。 

今后 ， 我 们 将 使 用 Java 的 java.util.TreeMap 来 完成 我 们 的 有 序 符 号 表 API 的 参考 实现 
ST， 这 是 一 种 基于 红 黑 树 的 符号 表 实 现 。 如 果 你 还 选修 了 数据 结构 和 算法 等 高 级 课程 ， 你 
会 学 习 到 更 多 关于 红 黑 树 的 知识 。 它 们 支持 getO、putO 以 及 刚刚 描述 的 许多 其 他 操作 ， 并 
能 够 提供 对 数 运 行 时 间 保证 。 

集合 数据 类 型 ”作为 最 后 一 个 例子 ， 我 们 讨论 一 种 比 符号 表 更 简单 的 数据 类 型 ， 其 应 用 
也 十 分 广泛 ， 并 且 使 用 散 列表 或 二 又 搜 索 树 可 以 很 容易 地 实现 。 一 个 set 是 不 同 键 的 集合 ， 
类 似 于 符号 表 但 不 包含 值 。 我 们 可 以 使 用 ST 并 忽略 这 些 值 ， 但 使 用 以 下 API 的 客户 程序 代 
码 会 更 简洁 、 更 清晰 : 
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public class SET<Key extends Comparable<Key>> 


SETO 新 建 一 个 空 的 集合 
boolean isEmpty() 集合 是 否 为 空 ? 

void add(Key key) 问 集 合 中 添加 key 
void remove(Key key) 从 集合 中 删除 key 
boolean contains(Key key) key 是 否 在 集合 中 
int size() 集合 中 键 的 数量 

注意 : 还 应 实现 eraple <Key> 接 口 、 从 而 允许 客户 程序 使 用 foreach 循 环 访问 键 

通用 集合 的 API 


与 符号 表 一 样 ， 键 的 类 型 也 不 必 一 定 要 具有 可 比较 特性 。 但 是 ， 处 理 可 比较 的 键 是 常 
见 的 需求 ， 并 且 人 允许 我 们 支持 各 种 基于 顺序 的 操作 ， 所 以 我 们 在 API 中 包含 了 Comparable。 
通过 在 BST 代码 中 删除 对 val 的 引用 来 实现 SET 是 一 个 简单 的 练习 (具体 参见 练习 4.4.23 ) 。 
另外 ,， 开 发 一 个 基于 散 列 表 的 SET 实现 也 不 困难 。 

DeDup (程序 4.4.5 ) 是 一 个 SET 的 客户 程序 ， 从 标准 输入 中 读 取 一 系列 字符 串 ， 仅 在 
每 个 字符 串 的 第 一 次 出 现时 将 其 输出 〈 从 而 删除 重复 项 )。 在 本 节 末 尾 的 练习 中 ， 你 可 以 找 
到 更 多 其 他 SET 客户 程序 的 例子 。 

在 下 一 节 中 ， 我 们 将 通过 案例 研究 说 明理 解 这 种 基本 抽象 的 重要 性 。 652 


程序 4.4.5” 去 重 过 滤器 


public class DeDup 
{ distinct 标准 输入 上 不 同 
public static void main(String[] args) 字符 串 的 集合 
{ YW 过 滤 掉 重复 的 字符 串 <y “1 当前 字符 串 
SET<String> distinct = new SET<String>O; 
while (!StdIn.isEmpty()) 
{ /1/ 读 取 二 个 字符 串 ， 忽 略 重复 
String key = StdIn.readString(); 
if (!ldistinct.contains(key)) 
{ V 保存 并 打印 新 的 字符 串 
distinct.add(key); 
Stdout.print(Ckey) ; 


于 
Std0ut.println0) ; 


这 个 SET 客户 程序 是 一 个 过 滤器 ， 它 从 标准 输入 读 取 字 符 串 ， 并 将 字符 串 
写 入 标准 输出 ， 忽 略 重 复 的 字符 串 。 为 了 提高 效率 ， 程 序 使 用 一 个 包含 到 目前 
为 止 遇 到 的 不 同 字符 串 的 SET。 


% java DeDup < Tale0fTwoCities .txt 
it was the best of times worst age wisdom foolishness,... 





展望 ， 符 号 表 实 现 是 在 算法 和 数据 结构 中 进一步 学 习 的 主要 内 容 。 例 如 平衡 二 又 树 、 散 
列 和 Trie 树 。 在 Java 和 很 多 其 他 计算 环境 中 可 以 找到 许多 这 些 算法 和 数据 结构 的 实现 。 不 
同 API 和 不 同 的 关于 键 的 假设 需要 不 同 的 实现 。 算 法 和 数据 结构 领域 的 研究 者 仍然 在 研究 
各 种 不 同 符号 表 的 实现 。 


和 


py 
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哪 种 符号 表 的 实现 更 好 ? 是 散 列 表 ” 还 是 二 又 搜索 树 ? 首先 考虑 的 要 点 是 客户 程序 是 
否 存在 可 比较 键 ， 是 否 需要 符号 表 涉 及 与 顺序 相关 的 操作 (如 选择 或 排 位 )。 如 果 需 要 ， 则 
必须 使 用 二 又 搜索 树 。 如 果 不 需 要 ， 大 多 数 程序 员 倾 向 于 使 用 散 列表 ， 因 为 基于 散 列 表 的 符 
号 表 通 常 比 基 于 二 又 搜索 树 的 符号 表 快 (假设 拥有 一 个 对 于 键 数 据 类 型 具有 良好 性 能 的 散 列 
函数 )。 

使 用 二 又 搜索 树 实现 符号 表 和 集合 是 利用 树 抽 象 的 一 个 绝 佳 的 示例 ， 树 抽象 无 处 不 在 。 
我 们 对 日 常生 活 中 的 许多 树 结构 习以为常 ， 包 括 家 谱 、 体 育 比赛 、 公 司 组 织 结 构图 、 语 法 分 
析 树 等 。 树 也 在 许多 计算 应 用 程序 中 出 现 ;， 包括 函数 调用 树 、 编 程 语言 的 解析 树 和 文件 系 
统 。 树 的 许多 重要 应 用 植 根 于 科学 与 工程 ， 包 括 计 算 生物 学 中 的 系统 发 生 树 、 计 算 机 图 形 中 
的 多 维 树 、 经 济 学 中 的 极 大 极 小 博弈 树 以 及 分 子 动力 学 模拟 中 的 四 叉 树 。 还 有 其 他 更 复杂 的 
链接 结构 ， 我 们 将 在 4.5 节 中 讨论 。 

在 日 常生 活 中 ， 人 们 可 能 每 天 都 在 使 用 字典 、 索 引 和 其 他 类 型 的 符号 表 。 就 在 很 短 几 年 
中 ， 基 于 符号 表 的 应 用 程序 已 经 完全 取代 了 电话 矫 、 百 科 全 书 ， 以 及 各 种 一 千年 来 为 我 们 提 
供 服务 的 实物 。 如 果 没 有 基于 散 列 表 和 二 又 搜索 树 等 数据 结构 的 符号 表 的 实现 ， 这 些 应 用 程 
序 将 无 法 实现 ; 使 用 它们 ， 我 们 就 会 有 “所 有 的 东西 都 可 以 在 线 立 即 获 取 ” 的 感觉 。 
问答 环节 

问 : 为 什么 使 用 不 可 变 的 符号 表 键 ? 

答 : 如 果 我 们 在 散 列 表 或 BST 中 更 改 键 ， 可 能 会 使 数据 结构 的 很 多 属性 失效 。 

问 : 为 什么 HashST 中 的 扔 套 Node 类 中 的 val 实 例 变 量 被 声明 为 Object 类 型 而 不 是 
Value 类 型 ? 

答 : 好 问题 ! 正如 我 们 在 3.1 节 结 束 时 的 问答 中 所 看 到 的 那样 ，Java 不 允许 创建 泛 型 
数组 。 这 种 限制 的 一 个 后 果 是 需要 在 get( 方法 中 进行 强制 转换 ， 这 会 导致 生成 编译 时 警告 
(即使 转换 在 运行 时 可 以 成 功 )。 请 注意 ,我 们 可 以 在 BST 中 将 艇 套 Node 类 中 的 val 实例 变 
量 声 明 为 Value 类 型 ， 因 为 它 不 使 用 数组 。 

问 : 为 什么 不 使 用 Java 库 中 的 符号 表 ? 

答 : 现在 你 已 经 理解 了 符号 表 的 工作 原理 ， 当 然 欢 迎 你 使 用 工业 级 的 java.util.TreeMap 
和 java.util.HashMap。 它 们 遵循 与 ST 相同 的 基本 API,， 但 允许 使 用 null 键 ， 并 分 别 使 用 方 
法 containsKey() 和 keySet()， 而 不 是 contains() 和 iterator()。 它 们 还 包含 各 种 其 他 实用 程 
序 方法 ,但 是 它们 不 支持 我 们 提 到 的 其 他 一 些 方法 ， 如 按 序 遍 历 。 你 也 可 以 使 用 java.util. 
TreeSet 和 java.util.HashSet， 其 实现 API 同 我 们 的 SET 一 样 。 


练习 


4.4.1 修改 程序 Lookup 以 生成 一 个 新 的 程序 LookupAndPut， 人 允许 put 操作 从 标准 输入 中 获取 输入 的 
数据 。 遵 循 这 样 的 约定 : 使 用 加 号 指示 其 后 两 个 键入 的 字符 串 是 将 被 插入 的 键 - 值 对 。 

4.4.2 ”修改 程序 Lookup 以 生成 一 个 新 的 程序 LookupMultiple， 当 多 个 值 对 应 于 同一 个 键 的 时 候 ， 将 
这 些 值 存放 到 一 个 队列 中 (类似 于 程序 Index)。 然 后 使 用 一 个 get 请 求 输出 所 有 的 内 容 ， 运 行 
过 程 和 结果 如 下 : 


% java LookupMultiple amino.csv 3 0 


Leucine 
TIA TTG CTT CTC CTA CTG 
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4.4.3” 修改 程序 Index 以 创建 一 个 新 的 程序 fmdexByKeyword， 从 命令 行 接收 一 个 文件 名 作为 参数 ， 仅 
使 用 该 文件 中 的 关键 字 从 标准 输入 中 生成 索引 。 注 意 : 使 用 相同 的 文件 作为 索引 ， 并且 关 键 字 
的 生成 结果 和 程序 Index 一 致 。 

4.4.4 ”修改 程序 Index 以 生成 一 个 新 的 程序 IndexLines， 仅 考虑 连续 的 字符 序列 作为 键 : (不 包括 标点 
符号 或 数字 )， 并 使 用 行 号 代替 单词 位 置 作为 值 。 该 功能 可 以 用 于 程序 源 代码 分 析 : 


% java IndexLines 6 0 < Index.java 
continue 12 

enqueue 15 

Integer 4 57814 

parseInt 4 5 

println 22 


4.4.5 ”请 为 符号 表 API 编写 一 种 实现 BinarySearchST， 维 护 键 和 值 的 平行 数组 ， 并 按键 排序 。 在 实现 
get 时 使 用 二 分 查找 法 ， 在 实现 put 时 将 大 的 元 素 向 右 移动 一 个 位 置 以 挪 出 空位 放 新 数据 (使 用 
可 变数 组 ， 以 保持 数组 长 度 与 符号 表 中 键 - 值 对 数量 的 线性 关系 )。 使 用 Index 测试 你 的 实现 ， 
并 验证 如 下 假说 : 使 用 这 种 方式 实现 Index 时 ， 消 耗 的 运行 时 间 正 比 于 字符 串 的 个 数 与 输入 中 
不 同 字符 串 的 数量 的 乘积 。 

4.4.6 ”请 编写 符号 表 API 的 一 种 实现 SequentialSearchST， 维 护 一 个 包含 键 和 值 的 节点 的 链表 ， 其 顺 
序 任意 。 使 用 程序 Index 测试 你 的 实现 ， 并 验证 如 下 假说 : 程序 Index 使 用 这 种 实现 所 消耗 的 
运行 时 间 正 比 于 字符 串 的 个 数 与 输入 中 不 同 字符 串 的 数量 的 乘积 。 

4.4.7 以 下 每 个 字符 是 一 个 字符 串 ， 请 计算 每 个 字符 串 的 x.hashCode()%5: 

EASYQUESTION 
按照 正文 中 的 方法 ,给 出 当 序 列 中 的 第 i 个 键 与 值 i 关联 (i 从 0 到 11) 时 的 散 列 表 。 

4.4.8 ”请 为 程序 HashST 实现 方法 contains()。 

4.4.9 ”请 为 程序 HashST 实现 方法 size()。 

4.4.10 ”请 为 程序 HashST 实现 方法 keys()。 

4.4.11 请 修改 HashST， 增 加 一 个 带 Key 参数 的 remove() 方法 ， 用 以 从 符号 表 中 删除 该 键 及 对 应 的 值 
(如 果 存 在 的 话 )。 

4.4.12 ”请 修改 HashST， 使 用 可 变数 组 实现 ， 使 得 与 每 个 散 列 值 关 联 的 链表 长 度 在 1 到 8 之 间 。 

4.4.13 ” 当 按照 如 下 顺序 将 键 插入 一 个 初始 为 空 的 树 后， 绘制 所 生成 的 BST: 

EASYQUESTION 


请 问 BST 的 高 度 是 多 少 ? 
4.4.14 ”假设 一 个 BST 的 键 包 含 了 1 到 1000 之 间 所 有 的 整数 ， 请 搜索 363。 如 下 序列 哪个 不 可 能 是 检 
测 过 程 的 序列 ? 
a. 2 252 401 398 330 363 b. 399 387 219 266 382 381 278 363 
c. 3 923 220 911 244 898 258 362 363 d. 4 924 278 347 621 299 392 358 363 


e. 5 925 202 910 245 363 
4.4.15 ”假设 一 个 高 度 为 4 的 BST 中 包含 下 列 31 个 键 ( 按 某 种 顺序 ) 


10 15 18 21 23 24 30 30 38 41 42 45 50 55 59 
60>61 63 71 77 78 83 84 85 86 88 91 92-93 94 98 


请 绘制 树 最 上 面 的 三 个 节点 ( 根 和 它 的 两 个 子 节点 )。 
4.4.16 ”请 为 如 下 键 序列 绘制 所 有 不 同 的 BST。 


best of it the time was 
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4.4.17 


4.4.18 


4.4.19 
4.4.20 


4.4.21 


4.4.22 


4.4.23 


4.4.24 
4.4.25 


4.4.26 


4.4.27 


4.4.28 


4.4.29 


4.4.30 


4.4.31 


4.4.32 


务 4 昔 


判断 题 : 给 定 一 个 BST， 假设 x 为 叶子 节点 , p 为 它 的 父 节点 。 请 判断 :( 1 ) p 的 键 是 BST 中 
大 于 x 的 键 的 最 小 值 。( 2 ) p 的 键 是 BST 中 小 于 x 的 键 的 最 大 值 。 

请 实现 BST 的 方法 contains()。 

请 实现 二 分 查找 树 的 方法 size()。 

请 修改 BST， 添 加 一 个 带 参数 Key 的 remove() 方法 ， 从 符号 表 中 删除 该 键 及 对 应 的 值 (如 果 
存在 的 话 )。 提 示 : 将 键 (及 其 关联 值 ) 替换 为 BST 中 小 于 它 的 最 大 键 (及 其 关联 值 )。 然 后 从 
BST 中 删除 那个 用 来 替换 的 节点 。 

使 用 一 个 递归 辅助 方法 如 traverse() 为 BST 实现 toString0 方 法 。 像 往常 一 样 ， 由 于 字符 串 拼 
接 的 代价 ， 这 种 实现 的 时 间 复 杂 度 是 二 次 型 的 。 加 分 题 : 请 使 用 StringBuilder 为 BST 编写 一 
个 线性 时 间 的 toString() 方法 。 

请 修改 符号 表 API， 通 过 使 get() 方法 返回 一 个 值 的 迭代 器 ， 来 处 理 一 个 键 对 应 多 个 值 的 情况 。 
按照 此 API 的 规定 实现 BST 和 Index。 请 比较 这 个 方法 与 正文 中 所 讨论 方法 的 优 缺 点 。 

请 修改 BST， 以 实现 本 节 最 后 给 出 的 SET API。 

请 修改 HashST 来 实现 本 节 最 后 给 出 的 SET API (从 API 中 移 除 Comparable)。 

词汇 索引 (concordance) 是 一 个 按 字母 排序 的 索引 表 ， 给 出 了 一 个 文本 中 每 个 单词 的 出 现 位 
置 。 因 此 ， 运行“java index 0 0” 得 到 的 就 是 一 个 词汇 索引 。 曾 经 有 一 个 著名 的 研究 ， 一 组 研 
究 人 员 试 图 通过 制作 一 个 公开 的 词汇 索引 来 考证 死海 古 卷 ( Dead Sea Scrolls) 的 可 信和 度 ， 同 时 
保证 它 的 细节 内 容 不 被 公开 。 请 编写 一 个 程序 InvertConcordance， 接 收 一 个 命令 行 参数 n， 从 
标准 输入 中 读 取 一 个 词汇 索引 ， 在 标准 输出 中 输出 对 应 文本 的 前 n 个 单词 。 

运行 实验 以 验证 正文 中 的 如 下 假说 : 当 使 用 ST 时 ，Lookup 和 Index 的 put 操作 和 get 请 求 的 
时 间 复 杂 度 是 符号 表 大 小 的 对 数量 级 。 请 开发 一 个 测试 客户 程序 ， 随 机 生成 若干 个 键 ， 并 基 
于 不 同 数据 集运 行 测 试 ， 数 据 集 可 以 来 自 于 本 书 网 站 或 自己 选择 。 

请 修改 程序 BST， 增 加 方法 min0 和 max()， 用 于 返回 表 中 的 最 小 键 (或 最 大 键 )， 如 果 表 中 不 
存在 键 ， 则 返回 null。 

请 修改 程序 BST， 添 加 带 一 个 参数 的 方法 ceiling() 和 floor()， 用 于 返回 符号 表 中 不 比 给 定 键 
大 (小 ) 的 最 大 (最小) 键 (如 果 没 有 这 样 的 键 存在 则 返回 null) 。 

请 修改 程序 BST， 实 现 方法 size() 以 返回 符号 表 中 键 - 值 对 的 数量 。 为 了 实现 这 一 功能 ， 可 以 
在 每 个 节点 Node 内 存储 以 该 节点 为 根 的 子 树 的 节点 数量 。 

请 修改 程序 BST， 增 加 一 个 方法 rangeSearch()， 需 要 两 个 键 作为 参数 ， 返 回 两 个 给 定 键 之 间 
所 有 键 的 迭代 器 。 运 行 时间 应 正比 于 树 的 高 度 加 上 范围 内 键 的 数量 。 

请 修改 程序 BST， 增 加 一 个 方法 rangeCount()， 需 要 两 个 键 作为 参数 ,返回 两 个 指定 键 之 间 所 
有 键 的 数量 。 你 的 方法 消耗 的 运行 时 间 应 该 正比 于 树 的 高 度 。 提 示 : 首先 完成 上 一 道 练 习 。 

请 编写 一 个 ST 的 客户 程序 ， 创 建 一 个 符号 表 ， 用 于 将 字母 等 级 成 绩 映 射 到 数值 分 数 ， 如 下 表 
所 示 ， 然 后 从 标准 输入 中 读 取 字母 等 级 列表 ， 并 计算 其 平均 值 (GPA)。 


A+ A A GE. pi PE 6G。 下 
4.33 4.00 3.67 3.33 3.00 2.67 2.33 2.00 1.67 1.00 0.00 


二 叉 树 练习 


以 下 练习 的 目的 是 增强 读者 对 于 二 又 树 (不 一 定 是 BST) 的 理解 。 习 题 中 都 假设 一 个 
Node 类 具有 三 个 实例 变量 : 一 个 double 型 变量 (总 是 正 数 ) 和 两 个 Node 的 引用 ， 与 链表 一 
样 ， 你 会 发 现 最 有 用 的 方法 是 使 用 正文 中 描述 的 可 视 化 表示 方法 绘制 图 形 。 
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4.4.33 ”实现 如 下 函数 ， 每 个 函数 的 参数 都 是 一 个 Node 类 型 ， 用 于 表示 二 叉 树 的 根 。 
int size() 树 中 的 节点 数 
int leavesQO 链接 都 为 nu11 的 节点 的 数量 
double total10) 所 有 节点 的 键 值 之 和 
你 的 方法 都 应 该 在 线性 时 间 内 运行 。 

4.4.34 ”请 实现 一 个 线性 运行 时 间 的 函数 height()， 对 于 所 有 根 节点 到 叶 节 点 ( 单 节点 树 的 高 度 为 0) 
的 路 径 ， 返 回 节 点 数量 最 多 的 那 一 条 路 径 的 节点 数量 。 

4.4.35 ”如 果 一 个 二 叉 树 根 节点 的 键 大 于 所 有 后 代 的 键 ， 则 称 二 又 树 是 堆 有 序 的 。 请 实现 一 个 线性 运 
行 时 间 的 方法 heapOrdered0) ， 如 果树 是 堆 有 序 的 ， 则 返回 true， 和 否则 返回 false。 

4.4.36 一 棵 二 叉 树 为 平衡 树 的 条 件 是 其 两 棵 子 树 是 平衡 树 且 其 两 棵 子 树 的 高 度 最 多 相差 1。 请 实现 一 
个 线性 运行 时 间 的 方法 balanced()， 如 果树 是 平衡 树 ， 则 返回 true; 否则 返回 false。 

4.4.37 ” 当 两 棵 二 叉 树 具有 相同 的 形状 ， 仅仅 是 键 值 不 同时 ， 我 们 称 其 为 同 构 (isomorphic)。 请 实现 线 
性 运行 时 间 静 态 方 法 isomorphic()， 以 两 棵 树 的 引用 作为 参数 ， 如 果 两 棵 树 为 同 构 则 返回 true， 
否则 返回 false。 然 后 ， 实 现 一 个 线性 运行 时 间 的 静态 方法 eq()， 以 两 棵 树 的 引用 作为 参数 ， 
如 果 它 们 引用 的 是 一 样 的 树 ( 同 构 且 值 相同 )， 则 返回 true， 否 则 返回 falses 

4.4.38 ”请 实现 一 个 线性 运行 时 间 的 函数 isBSTO ， 如 果 一 棵 二 又 树 是 BST 则 返回 true， 否 则 返回 false。 

答案 : 这 个 任务 比 表面 看 起 来 更 复杂 。 使 用 一 个 递归 辅助 函数 isBST()， 增 加 两 个 参数 lo 

和 fhi， 如 果 二 又 树 为 BST 并 且 所 有 值 在 lo 和 hi 之 间 ， 则 返回 true。 使 用 null 来 表示 可 能 的 最 
大 和 最 小 键 值 。 
public static boolean isBST() 
{ return isBST(root, null, nul1); } 
private boolean isBST(Node x, Key 1o, Key hi) 
{ 

if (x == null) return true; 

if (lo != null && x.key.compareTo(l1lo) <= 0) return false; 

if (hi != null && x.key.compareTo(hi) >= 0) return false; 

if (!isBST(x.left, lo, x.key)) return false; 

if (!isBSTCx.right, x.key, hi)) return false; 
» 

4.4.39 ”请 编写 一 个 函数 levelOrder()， 以 层 序 输出 BST 的 键 : 首先 输出 根 ; 然后 从 左 到 右 输 出 根 下 一 层 的 
所 有 节点 ; 然后 是 根 节点 下 两 层 的 所 有 节点 (从 左 到 右 )， 以 此 类 推 。 提 示 : 使 用 Queue<Node>。 

4.4.40 阅读 下 面 的 程序 ， 计 算 针 对 某 些 二 又 树 的 返回 结果 。 然 后 估计 此 段 程序 对 于 任意 二 又 树 的 执 
行 结果 ， 并 证 明 。 
public int mystery(Node x) 

{ 
if (x == null) return 0; 
return mystery(x.left) + mystery(x.right); 
} 
答案 : 任何 二 叉 树 都 返回 0。 
创新 练习 
4.4.41 拼写 检查 。 请 编写 一 个 SET 的 客户 程序 SpellChecker， 从 命令 行 接收 一 个 包含 单词 字典 的 文 


件 名 作为 参数 ， 然 后 从 标准 输入 读 取 字符 串 ， 输 出 那些 在 字典 中 不 存在 的 字符 串 。 你 可 以 在 
本 书 网 站 找到 一 个 字典 文件 。 加 分 题 : 扩展 你 的 程序 以 处 理 常见 的 后 级 ， 如 -ing 或 -ed。 


662 


FE 一 


GTO 
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党 子 间 


4.4.42 


4.4.43 


4.4.44 


4.4.45 


4.4:46 


4.4.47 


4.4.48 


4.4.49 


4.4.50 


4.4.51 


4.4.52 


4.4.53 


4.4.54 


拼写 更 正 。 编 写 一 个 ST 的 客户 程序 SpellCorrector， 该 程序 是 一 个 过 滤器 ， 用 于 提示 并 建议 
替换 标准 输入 中 常见 拼写 错误 的 单词 ， 并 把 结果 写 人 标准 输出 。 从 命令 行 接收 包含 常见 拼写 
错误 和 更 正 的 文件 作为 参数 。 在 本 书 网 站 可 以 找到 一 个 示例 。 

Web 过 滤器 。 编 写 一 个 SET 客户 程序 WebBlocker， 从 命令 行 接收 一 个 包含 不 良 网 站 列表 的 文 
件 作为 参数 ， 然 后 从 标准 输入 中 读 取 字 符 串 ， 并 仅 输出 不 在 列表 中 的 网 站 。 

集合 操作 。 请 在 SET 中 增加 两 个 方法 union() 和 intersection()， 以 两 个 集合 作为 参数 ， 并 分 别 
返回 这 两 个 集合 的 并 集 和 交集 。 

频率 符号 表 。 请 开发 一 个 数据 类 型 FrequencyTable， 支 持 以 下 操作 : click() 和 count()。 两 个 函 
数 均 带 有 字符 串 参数 。 数 据 类 型 中 需要 记录 使 用 给 定 字符 串 作 为 参数 调用 click() 的 次 数 ， 每 
次 调用 click() 操作 会 使 相应 的 计数 递增 1，count(O 操作 则 返回 计数 器 的 值 (可 能 为 0 )。 该 数 
据 类 型 可 以 用 于 Web 流量 分 析 器 、 统 计 每 首 歌 播 放 次 数 的 音乐 播放 器 、 统 计 呼 叫 次 数 的 电话 
软件 等 。 

一 维 范围 搜索 。 请 开发 一 个 数据 类 型 以 支持 如 下 操作 : 插入 一 个 日 期 、 查 找 一 个 日 期 、 统 计数 
据 结构 中 位 于 特定 区 间 的 日 期 数量 。 使 用 Java 的 java.util.Date 数据 类 型 。 

非 重 登 区 间 搜 索 。 给 定 一 个 非 重 释 整 数 区 间 列 表 ， 请 编写 一 个 函数 ， 该 函数 需要 一 个 整数 
参数 ， 确 定 该 整数 所 处 的 区 间 (如 果 存 在 )。 例 如 ， 如 果 区 间 是 1643 一 2033、5532 一 7643、 
8999 一 10332 和 5666653 一 5669321， 则 查询 点 9122 位 于 第 三 个 区 间 中 ， 而 8122 不 在 任何 区 
间 中 。 

查询 了 P 所 属国 家 。 编 写 一 个 BST 的 客户 程序 ， 使 用 本 书 网 站 上 的 数据 文件 ip-to-country.csv， 
确定 一 个 给 定 的 IP 地 址 来 自 哪个 国家 。 该 数据 文件 包含 5 个 字段 : 开始 下 地址 范围 ,结束 IP 
地 址 范围 ， 两 个 字符 的 国家 代码 ， 三 个 字符 的 国家 代码 和 国家 名 称 。IP 地 址 不 重合 。 这 种 数据 
库 工 具 可 用 于 信用 卡其 诈 检测 、 垃 圾 邮件 过 滤 、 网 站 自动 语言 选择 以 及 网 站 服务 器 日 志 分 析 。 

网 页 的 反 向 索引 。 给 定 一 个 网 页 列表 ， 创 建 一 个 包含 网 页 中 所 有 单词 的 符号 表 。 把 每 一 个 单 
词 与 出 现 该 单词 的 网 页 列表 关联 起 来 。 编 写 一 个 程序 ， 读 取 一 个 网 页 列表 ， 创 建 一 个 符号 表 ， 
支持 单个 单词 查询 ， 并 返回 出 现 过 查询 单词 的 网 页 列表 。 

网 页 的 反 向 索引 。 扩 展 前 面 的 练习 ， 以 便 其 支持 多 个 单词 查询 。 在 这 样 的 情况 下 ， 输 出 包含 
每 个 查询 单词 都 出 现 了 不 少 于 一 次 的 网 页 列表 。 

多 词 搜索 。 编 写 一 个 程序 ， 从 命令 行 读 取 k 个 单词 ， 从 标准 输入 中 读 入 一 串 文 本 ， 从 这 串 文 
本 中 找 出 包含 所 有 这 k 个 单词 的 最 小 文本 区 间 (不 一 定 是 相同 的 顺序 )。 提 示 : 将 输入 的 文本 
串 按 单词 分 割 ， 每 一 个 赋予 一 个 下 标 ， 对 于 每 个 下 标 i， 找 到 包含 k 个 查询 词 的 最 小 区 间 [i， 
j]。 对 于 个 查询 词 ， 记 录 在 这 个 区 间 中 每 个 词 出 现 的 次 数 。 给 定 [i, j]， 通 过 递减 单词 i 的 计 
数 器 来 计算 [it1， 门 。 然 后 ， 递 增 j 直到 在 这 个 区 间 中 这 k 个 单词 都 出 现 了 至 少 一 次 (或 者 说 
直到 Word[i] 再 次 出 现 )。 

在 国际 象棋 中 重复 和 局 。 在 国际 象棋 游戏 中 ， 如 果 要 移动 子 一 方 连续 出 现 了 三 次 一 样 的 棋子 
布局 ， 则 移动 的 这 一 方 就 可 以 宣布 和 棋 。 描 述 如 何 使 用 计算 机 程序 识别 这 种 情况 。 

教务 安排 。 在 著名 的 东北 大 学 (美国 )， 教 务 处 曾经 安排 一 位 教师 在 同一 时 间 内 给 两 个 不 同 的 班 
级 授课 。 请 设计 一 种 方法 来 检查 这 种 冲突 ， 帮 助教 务 处 今后 避免 犯 这 种 错误 。 为 了 简单 起 见 ， 
假定 所 有 的 课程 均 为 50 分 钟 ， 且 开始 时 间 为 9 点 、10 点 、11 点 ， 以 及 下 午 1 点 、2 点、3 点。 
随机 元 素 。 请 在 程序 BST 中 添加 一 个 方法 random()， 返 回 一 个 随机 键 。 提 示 : 可 以 在 每 个 节 
点 中 保存 子 树 的 大 小 (请 参阅 练习 4.4.29 ) 。 运 行 时 间 应 与 树 的 高 度 成 正比 。 


4.4.55 


4.4.56 


4.4.57 


4.4.58 


4.4.59 


4.4.60 
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层 序 统计 。 在 BST 中 添加 一 个 方法 select0， 接 收 一 个 整数 参数 k， 并 返回 BST 中 第 k 个 最 小 键 。 
在 每 个 节点 中 保存 子 树 的 大 小 (具体 参见 本 节 练 习 4.4.29 )。 程 序 运 行 时 间 应 与 树 的 高 度 成 正比 。 
排名 查询 。 请 在 程序 BST 中 添加 一 个 rank() 方法 ， 接 收 一 个 键 作 为 参数 ， 返 回 BST 中 严格 小 
于 该 键 的 键 的 数量 。 在 每 个 节点 中 保存 子 树 的 大 小 (具体 参见 练习 4.4.29 ) 。 程 序 运行 时 间 应 
与 树 的 高 度 成 正比 。 

广义 队列 。 请 实现 一 个 支持 以 下 API 的 类 ， 它 扩展 了 队列 和 栈 ， 支持 删除 最 早 插入 的 第 i 个 项 
目 (请 参阅 练习 4.3.40 ): 


public class GeneralizedQueue<Item> 





GeneralizedQueue() 创建 一 个 空 的 广义 队列 
boolean isEmpty() 广义 队列 是 否 为 空 
void add(Item item) 将 项 目 item 择 六 广义 队列 中 
Mr 从 广义 队列 中 移 除 并 返回 第 i 个 最 早 
Item remove(int i) 维和 议 只 中 由 本 痊 并 返 四 第 i ME 
int size() 队列 中 项 目的 数量 
通用 广义 队列 的 API 665 


使 用 一 个 BST， 把 第 个 插入 的 元 素 与 键 关 联 起 来 ， 并 在 每 个 节点 保存 以 该 节点 为 根 节 
点 的 子 树 中 节点 的 总 数 。 为 了 查找 最 近 插入 的 第 i 个 项 目 ,需要 在 BST 中 搜索 第 i 个 最 小 的 项 。 
稀 朴 向 量 。 如 果 一 个 4 维 向 量 中 非 零 值 的 数量 很 少 ， 则 称 为 稀疏 向 量 。 你 的 目标 是 设计 一 种 
向 量 表示 方法 ， 所 使 用 的 空间 正比 与 其 非 零 值 个 数 ， 且 可 以 实现 两 个 稀 朴 向 量 的 加 法 ， 要 求 
其 运行 时 间 正 比 于 非 零 值 个 数 之 和 。 实 现 一 个 支持 以 下 API 的 类 : 


public class SparseVector 


SparseVector() 创建 一 个 稀 玻 向 量 
void put(int i，double v) “将 稀 玻 向 量 a 的 第 i 个 元 素 设置 为 v 
double get(int ji) 返回 稀 玖 向 量 a 的 第 i 个 元 素 


double dot(SparseVector b) 稀疏 向 量 的 点 积 
SparseVector plus(SparseVector b) 稀 政 向 量 的 向 量 和 


由 double 值 构成 的 稀 朴 向 量 的 API 
稀 朴 答 阵 。 如 果 二 个 Xz2 矩阵 的 非 零 值 个 数 正 比 于 地 (或 更 少 )， 则 称 为 稀 玻 矩阵 。 你 的 目标 
是 设计 一 种 矩阵 表示 方法 ， 所 使 用 的 空间 与 其 非 零 值 个 数 成 正比 ， 并 且 能 够 实现 两 个 稀 朴 矩 
阵 相 加 ， 要 求 其 运行 时 间 正 比 于 非 零 值 个 数 之 和 (可 能 还 有 一 个 额外 的 lgn 因子 )。 实 现 一 个 
支持 以 下 API 的 类 : 


public class SparseMatrix 


SparseMatrix() 创建 一 个 稀 玖 矩阵 
void putCint i，int j，double v) 将 稀 朴 矩阵 a 的 第 i 衙 第 j 列 元 素 设 置 为 v 
double get(int i, int j) 返回 稀 政 矩阵 a 的 第 i 行 第 j 列 元 素 
SparseMatrix plus(SparseMatrix b) 稀疏 矩阵 的 加 法 
SparseMatrix times(SparseMatrix b) 稀 踊 和 托 阵 的 乘法 
由 double 值 构成 的 稀疏 矩阵 的 API 


无 重复 队列 。 请 创建 一 个 队列 数据 类 型 ， 任 意 时 刻 在 队列 中 一 个 项 目 至 多 可 以 出 现 一 次 。 如 
果 某 个 元 素 已 经 在 队列 中 存在 ， 则 忽略 其 插入 请 求 。 
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4.4.61 可 变 字 符 串 。 请 创建 一 个 数据 类 型 ， 支 持 字符 串 如 下 表 所 示 的 API。 请 使 用 一 个 BST 并 采用 


对 数 型 时 间 实 现 所 有 操作 。 
public class MutableString 
MutableString() 新 建 一 个 空 的 可 变 字符 串 
char get(int i) 返回 可 变 字符 串 对 象 中 的 第 个 字符 
void insert(int i，char c)” 将 字符 c 插 入 可 变 字符 串 对 象 的 第 i 个 位 置 
void delete(int i) 删除 可 变 字符 串 对 象 的 第 i 个 字符 
int length() 返回 可 变 字符 串 的 长 度 
可 变 字符 串 的 API 


4.4.62 ”赋值 语句 。 请 编写 一 个 程序 ， 解 析 包含 赋值 语句 的 程序 并 对 其 求 值 ， 和 汪 本人 所 全 江 和 
型 算术 表达 式 语句 (参见 程序 4.3.5 )。 例 如 ， 给 定 输入 : 


print(D) 


你 的 程序 应 该 打印 出 值 225。 假 设 所 有 的 变量 和 值 都 是 double 类 型 的 。 请 使 用 一 个 符号 表 保 
存 并 跟踪 变量 名 。 

4.4.63 ” 灶 。 我 们 定义 一 个 包含 个 单词 (其 中 个 互 不 相同 ) 的 文本 语料库 的 相对 炉 如 下 : 

667 E=1/(n lg n) (po lg(K/po)+p1 lg(K/p1)+t***+pr-1 lg(K/pr-1)) 
其 中 pi; 是 单词 i 出现 次 数 的 百分率 。 请 编写 一 个 程序 ， 读 取 一 个 文本 语料库 ， 输 出 其 相对 

炉 。 请 将 所 有 的 字母 转换 为 小 写字 母 ， 并 把 标点 符号 都 看 作 空格 。 

4.4.64 动态 离散 分 布 。 创 建 一 个 数据 类 型 ， 支 持 以 下 两 个 操作 : add() 和 random()。add() 方法 插入 一 
个 新 项 到 数据 结构 中 ， 如 果 该 项 不 存在 则 插入 ; 否则 ， 把 其 频率 计数 递增 1。random() 方法 随 
机 返回 一 个 项 ， 其 概率 按照 每 个 元 素 的 频率 加 权 。 在 每 个 节点 中 保存 子 树 的 大 小 (请 参阅 练习 
4.4.29 ) 。 程 序 运行 时 间 应 与 树 的 高 度 成 正比 。 

4.4.65 股票 账户 。 在 StockAccount (程序 3.2.8 ) 中 实现 buy() 和 sell0 两 种 方法 。 使 用 符号 表 来 存储 
每 只 股票 的 股 数 。 

4.4.66 ”密码 子 使 用 表 。 请 编写 一 个 程序 ， 使 用 符号 表 输 出 来 自 标 准 输入 的 基因 组 密码 子 的 概率 统计 
信息 (每 千 个 的 频率 )， 如 下 所 示 : 


UUU 13.2 UCU 19.6 UAU 16.5 UGU 12.4 
UUC 23.5 UCC 10.6 UAC 14.7 UGC 8.0 
UUA 5.8 UCA 16.1 UAA 0.7 UGA 0.3 
UUG 17.6 UCG 11.8 UAG 0.2 UGG 9.5 
CUU 21.2 CCU 10.4 CAU 13.3 CGU 10.5 
CUC13.5° ‘CCE 54.9%CAC™ 8.2 (CGC 4:2 
CUA 6.5 CCA 41.0 CAA 24.9 CGA 10.7 
CUG 10.7 CCG 10.1 CAG 11.4 CGG 3.7 
AUU 27.1 ACU 25.6 AAU 27.2 AGU 11.9 
AUC 23.3 ACC 13.3 AAC 21.0 AGC 6.8 
AUA 5.9 ACA 17.1 AAA 32.7 AGA 14.2 
AUG 22.3 ACG 9.2 AAG 23.9 AGG 2.8 
GUU 25.7 GCU 24.2 GAU 49.4 GGCU 11.8 
GUC 15.3 GCC 12.6 CAC 22.1 GCC 7.0 
668 GUA 8.7 GCA 16.8 CAA 39.8 GCA 47.2 
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4.4.67 长 度 为 大 的 唯一 字符 串 子 串 。 编 写 一 个 程序 ， 从 命令 行 读 取 参 数 上 ， 从 标准 输入 读 入 文本， 并 
计算 该 文本 中 给 定 长 度 大 的 唯一 子 字符 串 的 数量 。 例 如 ， 如 果 输 入 是 GCCGGGCGCG， 则 有 
5 个 长 度 为 3 的 唯一 子 字符 串 : CGC、CGG、GCG、GGC 和 GGG。 这 种 计算 适用 于 数据 压缩 。 
提示 ; 使 用 字符 串 方法 substring(i，i+h) 来 抽取 第 i 个 子 字符 串 并 插入 符号 表 中 。 本 书 官网 提 
供 了 两 个 数据 集 ， 即 一 个 大 基因 组 以 及 " 的 前 一 千 万 位 数字 ， 用 它们 来 测试 你 的 程序 。 

4.4.68 ”随机 电话 号 码 。 编 写 一 个 程序 ， 从 命令 行 接收 整数 参数 n， 输 出 n 个 随机 电话 号 码 ， 格 式 为 
(XXX) XXX-XXxXx。 使 用 集合 来 避免 多 次 重复 选择 相同 的 号 码 。 请 使 用 合法 的 区 号 代码 (本 
书 官网 上 提供 合法 区 号 代码 的 文件 )。 

4.4.69 ”密码 检查 器 。 编 写 一 个 程序 ， 从 命令 行 接收 一 个 字符 串 参 数 ， 并 从 标准 输入 中 读 取 一 个 单词 
字典 ， 然 后 检查 字符 串 是 否 为 一 个 “好 ”的 密码 。 在 这 里 ， 假 定 “ 好 ”的 密码 意味 着 : (1 ) 
至 少 八 个 字符 的 长 度 ; (2 ) 不 是 字典 中 的 一 个 单词 ; (3 ) 不 是 字典 中 的 一 个 单词 加 数字 0 一 9 
(如 hello5 ); (4 ) 不 是 用 数字 分 隔 的 两 个 单词 (如 hello2world); (5) 再 次 检查 第 2 一 4 个 条 件 ， 
确认 没有 出 现 字典 中 单词 的 倒序 。 


4.5 案例 研究 : 小 世界 现象 


我 们 用 数学 模型 图 (graph) 来 研究 实体 间 成 对 性 质 。 图 能 够 帮助 我 们 研究 自然 世界 ， 也 
对 我 们 更 好 地 理解 和 改进 我 们 创建 的 网 络 非常 重要 。 在 过 去 的 一 个 世纪 里 ， 从 神经 生物 学 的 
神经 系统 模型 ， 到 医学 传染 病 的 传播 ， 再 到 电话 系统 的 发 展 ， 图 在 科学 和 工程 领域 发 挥 了 重 
要 的 作用 ， 其 中 也 包括 了 对 互联 网 发 展 的 推动 。 

某 些 图 显示 了 一 个 被 称 为 小 世界 现象 ( small-world phenomenon) 的 特定 属性 。 你 可 能 
熟悉 这 个 属性 ， 有 时 它 也 被 称 为 六 度 分 隔 ( six degrees of separation)。 其 基本 思想 是 : 即使 
我 们 每 个 人 认识 的 熟人 相对 较 少 ,， 但 想 在 世界 上 任意 两 个 陌生 人 之 间 建 立 联系 ， 所 需要 的 
人 际 链条 并 不 长 (六 度 分 隔 )。 这 一 假设 在 20 世纪 60 年 代 由 斯 坦 利 .米尔 格拉 姆 (Stanley 
Milgram) 通过 实验 验证 ， 并 在 20 世纪 90 年 代 由 邓肯 … 瓦 欧 (Duncan Watts) 和 斯 蒂 芬 斯 
特 罗 格 获 (Stephen Strogatz) 建立 了 数学 模型 。 近 年 来 ， 这 一 原理 在 各 种 各 样 的 应 用 中 被 证 
明 是 非常 重要 的 。 科 学 家 对 小 世界 图 感 兴趣 ， 因 为 它们 模拟 了 自然 现象 ;工程 师 对 此 也 有 兴 
趣 ， 因 为 利用 小 世界 图 的 自然 属性 可 以 更 好 地 构建 网 络 。 

在 本 节 中 ， 我 们 将 讨论 小 世界 现象 和 图 的 基本 计算 问题 。 事 实 上 ， 这 个 简单 的 问题 : 

一 个 既定 的 图 是 否 表现 出 小 世界 现象 ? 

带 来 的 重大 计算 任务 是 巨大 的 。 为 了 解决 这 个 问题 ， 我 们 将 研究 一 个 图 处 理 所 需 的 数据 类 型 
和 几 个 有 用 的 图 处 理 客 户 程序 。 具 体 来 说 ， 我 们 将 考察 一 个 计算 最 短路 径 ( shortest paths) 的 
客户 程序 ， 这 个 计算 本 身 有 着 很 多 重要 的 应 用 。 

本 节 另 一 个 主题 是 我 们 一 直 在 研究 的 算法 和 数据 结构 ， 它 们 在 图 处 理 中 起 着 核心 作用 。 
事实 上 ， 你 会 发 现 本 章 前 面 介绍 的 几 种 基本 数据 类 型 可 以 帮助 我 们 开 部 接 顶 点 
发 优雅 、 高 效 的 代码 ， 以 研究 图 的 属性 。 Fa 

图 为 了 避免 术语 混淆 ， 我 们 现在 给 出 一 些 定 义 。 图 包含 顶点 
(vertice) 集合 和 边 (edge) 的 集合 。 每 条 边 表示 两 个 顶点 之 间 的 连接 。 
如 果 两 个 顶点 通过 边 相 连 ， 则 两 个 顶点 邻接 ( adjacent)， 顶 点 的 度数 
( degree) 是 该 顶点 的 邻接 顶点 〈 或 邻居 ) 的 数量 。 请 注意 ， 这 里 所 说 


: ss 
边 - 顶点 的 


的 图 与 函数 图 像 (函数 值 的 图 像 ) 或 制图 (绘画 ) 的 概念 之 间 没 有 关 度 为 3 
系 。 我 们 经 常 通过 绘制 由 线 ( 边 ) 连接 带 有 标记 的 圆 ( 顶 点) 来 可 视 图 的 术语 
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化 地 表示 一 幅 图 ， 但 是 要 记 住 连接 本 身 才 是 重要 的 ， 而 非 我 们 描绘 它们 的 方式 。 

下 面 我 们 罗列 了 不 同 领 域 的 各 类 系统 ， 它 们 当中 都 有 图 的 应 用 ， 这 是 我 们 理解 图 结构 的 
最 佳 出 发 点 。 

交通 系统 (transportation systems)。 火 车 轨道 连接 站 ， 道 路 连接 交叉 口 ， 航 空 公司 航线 
连接 机 场 …… 所 有 这 些 系统 都 可 以 构建 成 简单 的 图 模型 。 毫 无 疑问 ， 你 肯定 使 用 过 基于 此 类 
模型 的 应 用 程序 。 例 如 ， 从 互动 式 地 图 程序 或 GPS 设备 获取 路 线 ， 或 使 用 在 线 服 务 进行 旅 
行 预订 ， 你 常常 关心 的 问题 是 : 从 这 里 到 那里 的 最 佳 途径 是 什么 ? 


顶点 边 

JFK JFK MCO 
MCO ORD DEN 
ATL ORD HOU 
ORD > DFW PHX 
HOU JFK ATL 
DFW ORD DFW 








DFW HOU 
ORD ATL 
LAS LAX 
ATL MCO 
pe 
交通 系统 的 图 模型 
人 类 生物 学 (human biology)。 动脉 和 静脉 连 系统 顶点 边 
接 器 官 ， 突 触 连接 神经 元 ， 关 节 连 接骨 骼 ， 因 此 对 ”让 公 现 旬 
人 体 生物 学 的 理解 取决 于 如 何 建立 适当 的 图 模型 。 wy 
也 许 这 个 领域 最 大 也 是 最 重要 的 建 模 挑战 是 人 脑 建 崩 骨 关节 骨头 
模 。 也 就 是 说 ， 神 经 元 之 间 的 局 部 连接 如 何 转化 为 i 2 
意识 、 记 忆 和 智力 ? 流行 病 学 人 感染 
社交 网 络 (social network)。 人 与 人 之 间 存 在 着 村 4 作用 为 
各 种 各 样 的 联系 ， 从 对 传染 病 的 研究 到 对 政治 倾向 进 传 学 基因 变异 
的 研究 ， 这 些 关系 的 图 模型 对 于 我 们 理解 它们 的 影 “和 2 人 尘 “要 和 质 。 。 相 作 用 
响 至 关 重 要 。 同 时 ; 信息 如 何在 在 线 社交 网 络 中 传 。 ”工程 系统 
播 的 问题 也 吸引 了 很 多 研究 者 。 交通 机 场 路 线 
物理 系统 (physical system)。 原 子 相 互 连 接 形 通信 由 pe 
成 分 子 ， 分 子 相互 连接 形成 物质 或 晶体 ， 粒 子 通过 计算 机 电线 
重力 或 磁力 等 相互 作用 力 连 接 。 例如， 图 模型 也 适 。。 yyw | 
用 于 研究 2.4 节 中 考虑 的 渗透 问题 。 当 系统 演化 发 用 户 电线 
展 时 ;局 部 作用 如 何 传播 ? 水 和 
通信 系统 (communications system)。 从 电路 用 户 卡车 路 线 
到 电话 系统 ， 到 互联 网 ， 再 到 无 线 服务 ,通信 系统 yj 和 
都 是 基于 设备 的 连接 而 建立 的 网 络 。 至 少 在 过 去 的 软件 模块 调用 
一 个 世纪 里 ， 图 模型 在 这 样 的 系统 开发 中 起 到 了 关 J Se 


键 的 作用 。 工 程 师 经 常 需要 知道 什么 是 设备 连接 的 典型 的 图 模型 
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最 佳 方式 。 

资源 分 配 (resource distribution)。 电 力 线路 连接 发 电站 和 家 庭 电 气 系 统 ， 管 道 连接 水 库 
和 家 庭 供水 ， 卡 车 路 线 连接 仓库 和 零售 店 。 研 究 资 源 分 配 的 有 效 和 可 靠 的 手段 取决 于 准确 的 
图 模型 。 例 如 ， 分 配 系 统 的 瓶颈 在 哪里 ? 

机 械 系统 (mechafiical system) 。 柱 架 或 钢 梁 连接 桥梁 或 建筑 物 的 接 缝 。 图 模型 帮助 我 
们 设计 这 些 系统 并 理解 其 特性 。 例 如 ， 哪 个 力 必须 由 一 个 结合 点 或 一 个 横梁 承受 ? 

软件 系统 ( software system) 。 一 个 程序 模块 中 的 方法 调用 其 他 模块 中 的 方法 。 正 如 我 
们 在 本 书 中 所 看 到 的 那样 ， 理 解 这 种 关系 是 软件 设计 成 功 的 关键 。 如 果 在 API 中 做 出 修改 ， 
哪些 模块 会 受到 影响 ? 

金融 体系 (financial system)。 交 易 连 接 账户 ， 账 户 将 客户 连接 到 金融 机 构 。 这 些 仅 仅 
是 人 们 用 来 研究 复杂 金融 交易 的 图 表 模 型 中 的 一 小 部 分 ， 并 有 助 于 更 好 地 理解 金融 交易 。 例 
如 ， 哪 些 交 易 是 例 行 的 ， 哪 些 标志 着 可 能 转化 为 利润 的 重要 事件 ? 


aaa.edu <- 一 一 顶点 


项 点 边 





aaa.edu aaa,edu Www.com 
WwW. Com ww.com fff.org 
mmm.net ww.com mmm.net 


fff.org ww.com ttt.gov 
ttt.gov ww.com fff.org 
www.com mmm.net 
mmm.net fff.org 
fff.org aaa.edu 
ttt .gov mmm. net ttt.gov aaa.edu 


ttt.gov mmm.net 
aaa.edu Vy 
fff.org 


mmm . net 





互联 网 的 图 模型 


这 些 模型 中 的 一 部 分 是 自然 现象 的 模型 ， 我 们 的 目标 是 通过 开发 简单 的 模型 来 获得 对 自 
然 世 界 的 更 好 理解 ， 然 后 用 它们 来 形成 假设 以 便 我 们 进行 测试 。 其 他 图 模型 是 我 们 自己 设计 的 
网 络 ， 我 们 的 目标 是 设计 一 个 更 好 的 网 络 ， 或 者 通过 了 解 网 络 的 基本 特性 来 更 好 地 维护 网 络 。 

无 论 大 小 ， 图 都 是 很 实用 的 模型 。 一 个 图 即便 只 有 几 十 个 顶点 和 边 〈 例 如 一 个 化 合 物 的 
模型 图 ， 其 中 顶点 是 分 子 ， 边 是 化 学 键 )， 也 已 经 算是 一 个 复杂 的 组 合 对 象 ， 因 为 这 些 顶 点 
和 边 已 经 可 以 组 合 出 成 二 上 万 种 图 ， 因 此 理解 某 些 特定 的 图 的 结构 和 特点 是 很 重要 的 。 具 有 
数 以 亿 计 或 万 亿 计 个 顶点 和 边 的 图 (例如 包含 所 有 电话 呼叫 数据 的 政府 数据 库 ， 或 人 类 神经 
系统 的 图 模型 ) 非常 复杂 ， 对 它们 的 研究 是 一 项 重大 的 计算 挑战 。 

图 的 处 理 通常 涉及 通过 文件 中 的 信息 构建 图 和 回答 关于 图 的 问题 。 除 了 刚刚 提 到 的 示例 
中 的 特定 应 用 的 问题 外 ， 我 们 经 常 需要 询问 有 关 图 的 基本 问题 。 图 有 多 少 个 顶点 和 边 ? 一 个 给 
定 项 点 的 邻接 顶点 有 哪些 ? 另外 ， 还 有 些 问题 取决 于 对 图 的 结构 的 理解 。 例 如 ， 图 中 的 路 径 
(path) 是 由 边 连 接 的 相 邻 顶点 的 序列 。 是 否 存在 连接 两 个 给 定 顶 点 的 路 径 ? 连接 两 个 顶点 的 最 
短路 径 的 长 度 ( 边 的 数量 ) 是 多 少 ? 在 本 书 中 我 们 已 经 看 到 了 几 个 比 这 些 更 复杂 的 科学 应 用 问 
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题 的 例子 。 随 机 游 走 落 在 每 个 点 的 概率 是 多 少 ? 某 个 图 所 代表 的 系统 渗透 的 概率 是 多 少 ? 
当 你 在 后 面 的 课程 中 遇 到 复杂 的 系统 时 ， 你 肯定 会 在 许多 不 同 的 应 用 场景 中 遇 到 图 。 你 


也 可 以 在 数学 、 运 筹 学 或 计算 机 科学 的 后 续 课 程 中 详 
细 研 究 其 属性 。 图 处 理 中 的 一 部 分 问题 相对 简单 ， 可 
以 用 我 们 一 直 在 学 习 的 这 些 数据 类 型 的 实现 方法 解 
决 ; 还 有 一 部 分 问题 提出 了 难以 克服 的 计算 挑战 ， 科 
学 家 们 还 在 寻求 高 效 的 解决 方案 。 

图 数据 类 型 ”图 处 理 算法 通常 首先 通过 添加 边 
来 构建 一 个 图 的 内 部 表示 ， 然 后 通过 遍历 顶点 和 与 给 
定 顶 点 的 邻接 顶点 来 处 理 它 。 以 下 是 支持 这 些 处 理 操 






从 LAX 到 MCO 


从 DEN 到 JFK 的 
长 度 为 3 的 路 径 
SS 





的 最 短路 径 
作 所 需 的 API: 图 的 路 径 
public class Graph 
GraphO) 创建 一 个 空 图 
Graph(In in, String delimiter) 从 输入 流 中 读 取 图 
void addEdge(String v, String w) 增加 vy-w 边 
int VO 顶点 
int EQ 边 数 
Iterable<String> vertices() 图 中 的 项 点 
Iterable<String> adjacentTo(String v) vy 的 邻接 项 点 


int 
boolean 
boolean 


degree(String v) 
hasVertex(String v) 
hasEdge(String v, String w) 


v 的 邻接 项 点 的 数量 
vy 是 图 中 的 顶点 吗 ? 
vy-w 是 图 中 的 边 吗 ? 


顶点 为 String 类 型 的 图 的 API 


像 往常 一 样 ， 这 个 API 反映 了 几 种 设计 选择 ,每 种 设计 选择 其 实 都 可 以 有 多 种 不 同 的 
方案 ,我 们 现在 对 其 中 的 一 部 分 进行 简要 讨论 。 

无 向 图 (undirected graph)。 边 是 无 向 (undirected) 的 ， 也 就 是 从 v 连接 到 w 的 边 和 从 
w 连 接 到 v 的 边 是 一 样 的 。 我 们 的 兴趣 在 于 连接 本 身 ， 而 不 是 连接 的 方向 。 有 向 边 〈 如 地 图 
中 的 单行 道 ) 需要 稍微 不 同 的 数据 类 型 (请 参见 练习 4.5.41 )。 

字符 串 顶 点 类 型 。 我 们 当然 可 以 用 一 个 泛 型 来 做 顶点 类 型 ， 从 而 使 得 客户 程序 可 以 用 任 
何 类 型 的 对 象 来 构建 图 。 然 而 ， 这 种 结果 的 代码 会 变 得 非常 元 长 ， 我 们 把 相关 实现 留 作 练 习 
(参见 练习 4.5.9 )。 对 于 我 们 在 这 里 的 应 用 ,字符 串 顶点 类 型 就 足够 了 。 

无 效 的 顶点 名 称 ( invalid vertex name)。 如 果 方 法 adjacentTo()、degree() 和 hasEdge() 
的 字符 串 参 数 不 能 与 任何 一 个 顶点 名 称 相 匹配 ， 则 会 抛 出 异常 。 客 户 程序 可 以 调用 
hasVertex() 来 检测 这 种 情况 。 

隐 式 顶点 创建 ( implicit vertex creation )。 当 一 个 字符 串 被 用 作 addEdge() 的 参数 时 ， 我 
们 假定 它 是 一 个 顶点 名 称 。 如 果 尚 未 添加 使 用 该 名 称 的 顶点 ， 则 我 们 的 实现 会 添加 这 样 一 个 
顶点 。addVertex() 方法 的 一 种 替代 设计 方案 是 由 客户 程序 主动 创建 顶点 ， 那 么 就 会 需要 更 多 
的 客户 程序 代码 (来 创建 顶点 ) 和 更 烦琐 的 实现 代码 (来 检查 连接 先前 创建 的 顶点 的 边 )。 

自 环 和 平行 边 ( self-loops and parallel edge)。 尽 管 API 没有 明确 地 解决 这 个 问题 ， 但 是 
我 们 假定 实现 确实 允许 自 环 (将 一 个 顶点 的 边 连接 到 顶点 自身 )， 但 不 允许 平行 边 (相同 边 的 
两 个 副本 )。 检 查 是 否 存在 自 环 和 平行 边 是 很 容易 的 ; 因此 我 们 选择 忽略 这 两 个 检查 。 

客户 程序 查询 方法 (client query method)。 我 们 的 API 中 还 包含 方法 V() 和 E()， 以 向 
客户 程序 提供 图 中 顶点 和 边 的 数量 。 类 似 地 ， 方 法 degree()、hasVertex() 和 hasEdge() 在 客 
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户 程序 代码 中 也 都 很 有 用 。 我 们 把 这 些 方 法 的 实现 作为 练习 放 在 后 面 ， 但 目前 我 们 假定 它们 


已 经 存在 于 我 们 的 Graph API 中 。 

这 些 设计 决策 都 不 是 “神圣 不 可 侵犯 的 ”; 它们 只 是 我 们 为 
本 书 中 的 代码 所 做 的 选择 。 有 一 些 选择 可 能 需要 根据 应 用 场景 而 
改变 ， 而 另 一 些 决 策 可 能 要 在 具体 实现 时 做 出 选择 。 因 此 ， 选 择 
这 个 设计 决策 的 原因 至 关 重 要 ， 值 得 仔细 思考 ， 并 在 做 出 选择 后 
做 好 准备 捍卫 它们 。 

Graph (程序 4.5.1 ) 实现 这 个 API。 它 的 内 部 表示 是 符号 表 
型 集合 (Symbol table of sets)， 键 是 顶点 ， 值 是 邻接 顶点 的 集合 
这 种 表示 使 用 了 我 们 在 4.4 节 介 绍 的 两 种 数据 类 型 ST 和 SET。 
它 有 以 下 三 个 重要 的 属性 : 

。 客户 程序 可 以 高 效 地 遍历 图 的 顶点 。 





。 客户 程序 可 以 高 效 地 遍历 顶点 的 邻接 顶点 。 符号 表 集 合 的 图 表示 


。 内 存 使 用 量 与 边 的 数量 成 正比 。 


这 些 属性 遵循 了 ST 和 SET 的 基本 属性 。 如 你 所 见 ， 这 两 个 迭代 器 是 图 处 理 的 核心 。 676 


程序 4.5.1 图 数据 类 型 
public class Graph 
{ 顶点 邻接 项 点 
集合 的 符号 下 


private ST<String, SET<String>> st; St 


public Graph() 

{ st = new ST<String, SET<String>>(); } 

public void addEdge(String v, String w) 

{ 7 把 v 放 到 w 的 SET 中 ， 把 w 放 到 V 的 SET 中 
if (!st.contains(v)) st.put(v, new SET<String>©O); 
if (!st.contains(w)) st,.put(w, new SET<String>©O); 
st.get(v).add(w); 
st.get(w) .add(v); 

} 

public Iterable<String> adjacentTo(String v) 

{ return st.get(v); 

public Iterable<String> vertices() 

{ return st.keysO; } 


/VUO、EO、degree0、hasVertex0、hasEdge() 的 实现 参见 练习 4.5.1 ~ 4.5.4 


public static void main(String[] args) 
{YW/ 从 标准 输入 读 职 边 二 出 结果 图 
Graph G = new Graph( 
while (!StdIn. py 
G.addEdge(StdIn.readString(), StdIn.readString(O)); 
StdOut .print (GC); 


这 个 实现 使 用 ST 和 SET ( 见 4.4 节 ) 来 实现 图 数据 类 型 。 客 户 程序 通过 添 
加 边 来 构建 图 ， 并 通过 迁 代 访问 顶点 以 及 与 每 个 项 点 相 邻 的 顶点 集 对 其 进行 
处 理 。 它 能 够 从 输入 流 读 入 一 个 图 。 请 参阅 正文 中 关于 对 toString0 和 与 之 匹配 
的 构造 器 ( 从 输入 流 读 入 图 ) 的 解释 。 


re tinyGraph .txt raph < tinyGraph .txt 


% mo 
AB 
AC 
CG 
AG 
HA 
BC 
BH 
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作为 客户 程序 代码 的 简单 示例 ， 我 们 分 析 如 何 打 印 Graph 的 问题 。 一 种 自然 的 方式 
是 打印 顶点 列表 ， 以 及 每 个 顶点 的 邻接 顶点 列表 。 我 们 使 用 如 下 方法 来 实现 Graph 中 的 
toString(): 


public String toString(O) 


String Se" 
for (String v : verticesQ)) 
{ 


So a Vy 
for (String w : adjacentTo(v)) 
CPR 


return s; 

} 

这 个 代码 将 每 条 边 打印 了 两 次 一 一 发 现 w 是 v 的 邻接 顶点 打印 一 次 ,发 现 v 是 w 的 邻 
接 顶 点 打印 一 次 。 许 多 图 算法 都 把 这 种 处 理 图 中 每 条 边 的 方式 作为 基本 范例 ， 但 务必 要 记得 
“每 条 边 均 处 理 了 两 次 ”! 像 往常 一 样 ， 这 个 实现 仅 适 用 于 小 型 图 ， 因 为 字符 串 连 接 是 线性 
时 间 ， 因 此 这 段 代 码 的 运行 时 间 与 字符 串 长 度 的 平方 成 正比 。 

刚才 所 分 析 的 输出 格式 定义 了 一 个 合理 的 文件 格式 : 每 一 行 都 是 一 个 顶点 名 称 ， 后 面 跟 
着 该 顶点 的 邻接 顶点 名 称 。 因 此 ， 我 们 的 图 的 基本 API 中 包含 了 一 个 构造 函数 ， 用 于 以 这 
种 格式 〈 带 有 邻接 顶点 的 顶点 列表 ) 从 输入 流 中 构建 图 。 为 了 灵活 ， 我 们 支持 在 顶点 名 之 间 
使 用 专用 的 分 隔 符 〈 不 必 一定 采 用 空格 当 分 隔 符 ， 因 此 顶点 名 称 可 能 包含 空格 )， 如 下 所 示 : 


public Graph(In in, String delimiter) 


st = new ST<String, SET<String>>©O; 
while (in.hasNextLine()) 
; String line = in.readLine(); 
String[] names = line.split(delimiter); 
for (int i = 1; i < names.length; i++) 
‘ addEdge(names[0], names[i]); 
站 
现在 我 们 将 看 到 ， 将 此 构造 函数 和 toString() 添加 到 Graph， 就 构成 了 一 个 完整 的 数据 
类 型 ， 可 以 适用 于 各 种 应 用 场景 。 请 注意 ， 当 输入 是 一 个 边 的 列表 ， 每 行 代表 一 条 边 时 ， 这 
个 相同 的 构造 函数 (使 用 空格 为 分 隔 符 ) 也 可 以 正常 工作 ， 就 像 程 序 4.5.1 的 测试 客户 程序 
一 样 。 
图 客户 程序 的 例子 ”作为 第 一 个 图 处 理 的 客户 程序 ， 我 们 考虑 一 个 社交 关系 的 例子 ， 这 
个 例子 对 你 来 说 非常 熟悉 ， 而 且 可 以 随时 获取 大 量 的 扩展 数据 。 
在 本 书 网 站 上 ， 你 可 以 找到 文件 movies.txt (以 及 许多 类 似 的 文件 )， 其 中 包含 电影 列表 
和 出 现在 其 中 的 演员 。 每 一 行 都 会 给 出 一 个 电影 的 名 字 ， 然 后 是 演员 名 单 〈 出 现在 该 电影 中 
的 表演 者 的 名 字 列 表 )。 由 于 名 字 中 包含 空格 和 逗号 ， 因 此 “/” 字 符 被 用 作 分 隔 符 〈 现 在 你 
应 该 明白 为 什么 我 们 的 第 二 个 Graph 构造 函数 将 分 隔 符 也 作为 参数 )。 
如 果 你 研究 movies.txt， 你 将 注意 到 一 些 特 性 ， 尽 管 它们 很 小 ， 但 在 使 用 这 些 数 据 时 需 
要 注意 : 
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电影 的 标题 后 总 跟着 年 份 〈 括 在 括号 中 )。 
存在 特殊 字符 。 
具有 相同 名 字 的 演员 用 括号 内 的 罗马 数字 加 以 区 分 。 
演员 表 不 是 按 字母 顺序 。 

根据 你 的 终端 窗口 和 操作 系统 的 设置 ， 特 殊 字 符 可 能 会 被 空白 符 或 问号 所 替代 s 处 理 大 
量 真实 世界 的 数据 时 ， 这 样 的 异常 是 常见 的 。 你 可 以 选择 接受 它们 ， 或 者 正确 地 配置 你 的 环 
境 (详情 请 参阅 本 书 网 站 )。 


% more movies.txt 


Tin Men (1987)/DeBoy, David/Blumenfeld, Alan/... /Geppi, Cindy/Hershey, Barbara 
Tirez sur le pianiste (1960)/Heymann, Claude/.../Berger, Nicole (1) 

Titanic (1997)/Mazin, Stan/...DiCaprio, Leonardo/.../Winslet, Kate/... 

Titus (1999)/Weisskopf, Hermann/Rhys, Matthew/.../McEwan, Geraldine 

To Be or Not to Be (1942)/Verebes, Ernd (1)/.../Lombard, Carole (I) 

To Be or Not to Be (1983)/.../Brooks, Mel (I)/.../Bancroft, Anne/... 

To Catch a Thief (1955)/Paris, Manuel/.../Grant, Cary/.../Kelly, Grace/... 

To Die For (1995)/Smith, Kurtwood/.../Kidman, Nicole/.../ Tucci, Maria 


电影 数据 库 示例 


Caligula 










Lloyd 
Bridges 
Whiplash 


Joe Versus 
the Volcano 











Bi11 
Paxton 


Pau1 
Herbert 










_The Da 


Vinci Code 


Serretta 
Wilson 







Cumberbatch 
电影 - 演员 图 的 一 小 部 分 


使 用 Graph， 我们 可 以 编写 一 个 简单 方便 的 客户 程序 以 从 文件 movies.txt 中 提取 信息 。 
我 们 首先 构建 一 个 Graph 来 更 好 地 组 织 信息 。 顶 点 和 边 应 该 怎么 建 模 ? 如 果 演 员 出 现在 
两 部 电影 中 ， 是 不 是 应 该 用 顶点 表示 电影 ， 再 用 边 把 他 们 连接 起 来 ? 如 果 两 个 演员 出 现在 


Imitation 
Came 
Kate 
Winslet 






Eternal Sunshine 
of the Spotless 
Mind 






TU WH Ye 
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同一 部 电影 中 ， 是 不 是 应 该 用 顶点 表示 演员 ， 再 用 边 把 他 们 连接 起 来 ?两 种 选择 都 是 合理 
的 ， 但 是 我 们 应 该 使 用 哪 一 种 呢 ? 该 决定 将 影响 客户 程序 和 实现 代码 。 另 一 种 处 理 方法 (我 
们 选择 它 是 因为 它 的 实现 代码 更 简单 ) 是 电影 和 演员 都 作为 顶点 ， 通 过 边 将 每 个 电影 连接 
到 该 电影 中 的 每 个 演员 。 正 如 你 所 看 到 的 ， 处 理 这 个 图 的 程序 可 以 回答 各 种 有 趣 的 问题 。 
IndexGraph (程序 4.5.2 ) 是 第 一 个 例子 ， 它 接受 一 个 查询 ， 比 如 一 个 电影 的 名 字 ， 并 打印 出 
现在 该 电影 中 的 演员 的 列表 。 


程序 4.5.2 ”使 用 图 来 反 转 索 引 


public class Indexcraph 


public static void main(String[] args) ky We 输入 流 9 
frijy 构造 一 个 图 -然后 执行 查询 fenig9e 寺 输入 分 融 符 
In in = new In(args[0]); 4 图 
String delimiter = args[1]; v 查询 
Graph G = new Graph(in, delimiter); W y 的 邻接 顶点 


while (StdIn.hasNextLine()) 
{ // 读 取 一 个 顶点 ， 然 后 打印 它 的 邻接 顶点 
String v = StdIn.readLine(); 
for (String w : G.adjacentTo(v)) 
Std0ut.println(” ”+ wW); 
} 
} 


这 个 Graph 客 户 程序 从 命令 行 指定 的 文件 创建 一 个 图 ; 然后 从 标准 输入 读 
取 项 点 名 称 并 打印 它 的 邻接 项 点 。 当 文件 对 应 一 个 电影 -演员 表 时 ， 我 们 就 会 
得 到 一 个 二 部 图 ;这 个 程序 相当 于 一 个 交互 式 的 反 转 索引 。 


% java IndexGraph tinyGraph.txt "" B® % java IndexGraph movies.txt "/" 
Da Vinci Code, The (2006) 

A Aubert, Yves 

B fee 

G Herbert, Paul 
A Eee 

B Wilson, Serretta 

2 Zaza, Shane 

G Bacon, Kevin 

H Animal House (1978) 


Apollo 13 (1995) 
Wild Things (1998) 


River Wild, The (1994) 
Woodsman, The (2004) 


输入 一 个 电影 名 称 并 获得 它 的 演员 表 只 不 过 是 在 movies.txt 中 返回 对 应 的 行 (尽管 
IndexGraph 打印 的 演员 列表 是 按照 姓氏 排列 的 ， 因 为 这 是 SET 提供 的 默认 迭代 顺序 )。 
IndexGraph 更 有 趣 的 功能 是 你 可 以 键入 一 个 演员 的 名 字 ， 并 获得 该 演员 出 演 的 电影 列表 。 
为 什么 能 实现 这 个 功能 呢 ?” 即 使 movies.txt 看 似 只 是 将 电影 连接 到 演员 ,但 是 图 中 的 边 也 是 
将 演员 连接 到 电影 的 连接 。 

如 果 所 有 项 点 可 以 分 成 两 个 不 相交 的 集合 ， 所 有 连接 都 将 一 个 集合 的 顶点 连接 到 另 一 集 
合 ， 这 样 图 被 称 为 二 部 图 (bipartite graph) (又 称 二 分 图 、 偶 图 等 一 一 译 者 注 )。 正 如 这 个 例 
子 所 说 明 的 ， 二 部 图 有 许多 自然 的 特性 ， 我 们 经 常 可 以 以 有 趣 的 方式 加 以 利用 。 

正如 我 们 在 4.4 节 的 开头 所 看 到 的 那样 ， 索 引 范 式 是 通用 而 且 非 常常 见 的 。 值 得 反思 的 
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是 ,构建 一 个 二 部 图 提供 了 一 个 简单 的 方法 来 自动 反 转 任何 索引 ! 文件 movies.txt 由 电影 来 


索引 ,但 我 们 也 可 以 通过 演员 查询 。 你 可 以 以 完全 相同 的 方 
式 使 用 IndexGraph 来 处 理 4.2 节 开 头 讨论 的 任何 索引 数据 ， 
如 打印 出 现在 给 定 页 面 上 的 索引 词 或 与 给 定 氨基 酸 相对 应 的 
密码 子 。 由 于 IndexGraph 将 分 隔 符 作 为 命令 行 参 数 ， 因 此 
可 以 使 用 它 为 .csv 创建 交互 式 的 反 转 索引 。 

这 种 反 转 索引 功能 是 图 数据 结构 (graph data structure ) 
的 直接 优势 。 接 下 来 ， 我 们 从 处 理 数 据 结构 的 算法 中 研究 一 
些 间接 优势 。 

图 的 最 短路 径 给 定 图 中 的 两 个 顶点 ， 路 径 (path) 是 
连接 它们 的 一 系列 边 。 最 短路 径 ( shortest path) 是 在 所 有 这 
些 路 径 上 长 度 (length) 或 距离 (distance， 边 的 数量 ) 最 小 的 
路 径 〈 通 常 有 多 条 最 短路 径 )。 寻 找 连接 图 中 两 个 顶点 的 最 短 
路 径 是 计算 机 科学 中 的 一 个 基本 问题 。 最 短路 径 已 经 成 功 地 
广泛 应 用 于 解决 大 规模 问题 ， 从 互联 网 路 由 到 金融 交易 ， 再 
到 大 脑 神经 元 的 动态 。 

举 个 例子 , 假设 你 是 一 个 假想 的 廉价 航空 公司 的 客户 ， 
这 个 航空 公司 服务 于 数量 有 限 的 城市 ， 并 且 航 线 数量 也 有 
限 。 假 设 从 一 个 地 方 到 男 一 个 地 方 的 最 佳 途径 是 尽 可 能 减少 
你 的 航 段 数量 ， 因 为 航班 延误 可 能 会 使 旅途 更 长 。 最 短路 径 


% more amino.csv 

TTT, Phe,F,Phenylalanine 
TTC, Phe,F,Phenylalanine 
TTA, Leu,L,Leucine 
TTG,Leu,L,Leucine 

TCT, Ser,S, Serine 

TCC, Ser,S, Serine 

TCA, Ser,S, Serine 

TCG, Ser,S, Serine 

TAT, Tyr,Y,Tyrosine 


GGA,Gly,G,Glycine 
GGG,Gly,G,Glycine 


% java IndexGraph amino.csv "," 
TTA 

Lue 

L 

Leucine 
Serine 


反 转 索引 


算法 正 是 你 计划 旅行 所 需要 的 。 这 样 理解 基本 问题 并 且 探 索 解决 这 个 问题 的 方法 ， 符 合 我 们 
的 直觉 。 但 接 下 来 在 这 个 例子 的 背景 中 ,我 们 将 考虑 一 个 更 加 抽象 的 图 模型 。 

根据 应 用 ， 客 户 对 于 最 短路 径 有 各 种 各 样 的 需求 。 我们 想 要 得 到 的 是 连接 两 个 给 定 顶 点 
的 最 短路 径 ， 还 是 只 是 这 样 一 条 路 径 的 长 度 ? 我 们 是 否 会 有 大 量 的 这 种 查询 ”有 没有 特别 感 
兴趣 的 特定 顶点 ? 在 大 型 图 中 或 者 面 对 大 量 的 查询 时 ， 我 们 必须 特别 注意 这 些 问 题 ， 因 为 计 
算 最 短路 径 的 代价 被 证 明 是 非常 巨大 的 。 我 们 从 下 面 的 API 开始 : 


public class PathFinder 





PathFinder(Graph G, String s) 


int distanceTo(String v) 


Iterable<String> pathTo(String v) 


图 的 单 源 最 短路 径 的 API 


构造 函数 
G 中 从 s 到 v 的 最 短 
路 径 的 长 度 
G 中 从 s 到 y 的 
最 短路 径 


客户 可 以 为 给 定 的 图 G 和 源 顶 点 (source vertex) s 构造 一 个 PathFinder 对 象 ， 然 后 使 


用 该 对 象 来 查找 最 短路 径 的 长 度 或 者 遍历 从 s 到 G 中 任何 其 他 顶点 的 最 短路 径 上 的 顶点 。 这 
些 方法 的 一 个 实现 被 称 为 单 源 最 短路 径 算 法 (single-source shortest-path algorithm ) 。 我 们 将 
考虑 一 个 解决 这 个 问题 的 经 典 算 法 ， 称 为 广度 优先 搜索 (breadth-first search)， 它 提供 了 一 
个 直接 且 简 洁 的 解决 方案 。 

单 源 客户 程序 。 假 设 你 已 经 有 了 一 个 廉价 航空 公司 的 地 图 ， 包 含 顶点 和 连接 。 然 后 ， 以 
你 的 家 乡 为 源 ， 你 可 以 编写 一 个 客户 程序 ， 在 你 想 要 去 旅行 的 时 候 随 时 打印 你 的 路 线 。 程 序 
4.5.3 是 PathFinder 的 一 个 客户 程序 ， 它 为 任意 图 提供 这 个 功能 。 这 种 客户 程序 在 处 理由 同 
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一 个 源 点 出 发 ， 到 不 同 终点 的 多 个 查询 的 应 用 中 特别 有 用 。 在 这 种 情况 下 ， 构 建 PathFinder 
对 象 的 成 本 将 在 所 有 查询 的 成 本 上 平 推 。 建 议 你 通过 在 我 们 的 示例 输入 文件 routes.txt 上 运 
行 PathFinder 来 探索 最 短路 径 的 属性 。 


人 
8) Gr 


Cr 


源 点 “终点 ” “距离 一 条 最 短路 径 

JFK LAX 3 JFK-ORD-PHX-LAX 

LAS MCO 4 ~ LAS-PHX-DFW-HOU-MCO 

HOU JFK 2 HOU-ATL-JFK 
的 最 短路 径 的 示例 


程序 4.5.3 ”最 短路 径 客户 程序 


public class PathFinder 


// 程序 4.5.3 中 有 基体 实现 
public static void main(String[] args) 


1/ 读 取 图 并 计算 源 点 s 的 最 短路 径 

In in = new In(args[0]); 

String delimiter = args[1]; 

Graph G = new Graph(in, delimiter); 
String s = args[2]; 

PathFinder pf = new PathFinder(G, s); 


/| 处 理 查询 
while (StdIn.hasNextLine()) eR 输入 流 
{ 二 
String t = StdIn.readLine(); delimiter | 输入 分 隔 符 
int d = pf.distanceTo(t); G 
for (String v : pf.pathTo(t)) s 源 点 
Stdout.println(” "+ V); . 2 
Stdout.println(C" distance " + d); en 
} v 路 径 上 的 顶点 
此 PathFinder 客 户 程 序 以 文件 名 称 、 分 隔 符 和 源 项 点 作为 命令 行 参 数 ， 它 
假定 文件 的 每 一 行 都 指定 了 一 个 顶点 和 一 个 连接 到 该 顶点 的 项 点 列表 ( 顶点 
之 间 用 分 隔 符 分 隔 ) ， 当 你 在 标准 输入 中 输入 一 个 目的 地 时 ， 你 得 到 从 源 到 目 
的 地 的 最 短路 径 。 
% more routes.txt % java PathFinder routes.txt " " JFK 
JFK MCO LAX 
ORD DEN JFK 
PHX LAX ORD 
ORD HOU PHX 
DFW PHX LAX 
ORD DFW 3 distance 3 
DFW 
JFK 
JFK ORD 
ORD 
HOU MCO DFW 
LAS PHX 


distance 2 
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.分隔 度 。 最 短路 径 算法 的 经 典 应 用 之 一 是 发 现 个 人 在 社交 网 络 中 的 分 隔 度 ( degree of 
separation)。 为 了 解决 这 个 问题 ， 我 们 用 一 个 叫 作 凯 文 贝 肯 的 流行 游戏 来 讨论 这 个 应 用 ， 
这 个 游戏 使 用 了 我 们 刚才 讨论 的 电影 - 演员 图 。 凯 文 ， 贝 肯 是 一 个 高 产 的 演员 ， 出 现在 很 多 
电影 中 。 我 们 给 在 电影 中 出 现 过 的 每 个 演员 分 配 一 个 凯 文 “ 贝 肯 数 : 贝 肯 本 人 是 0， 与 贝 肯 
共 演 过 的 演员 的 遍 文 " 贝 肯 数 是 1 ; 同 这 些 数 % java PathFinder movies.txt "/" "Bacon, Kevin" 
为 1 的 演员 ,也 就 是 这 些 与 贝 肯 共 演 过 的 演 pe 
员 , 再 共 演 的 其 他 任何 演员 (除了 贝 肯 本 人 ) Animal House (1978) 

的 凯 文 ， 贝 肯 数 是 2， 以 此 类 推 。 例 如 ， 梅 丽 Bu A We de 


Cold Mountain (2003) 


尔 . 斯 特 里 普 的 凯 文 * 贝 肯 数 是 1， 因 为 她 和 Kidman, Nicole 
凯 文 : 贝 肯 出 演 了 《 狂 野 之 河 ); 妮 可 . 基 德 “distance 4 
曼 的 数 是 2 : 虽然 她 没有 和 凯 文 贝 肯 一 起 出 。。 Bacon, Kevin 
演 过 电影 ， 但 是 她 和 唐纳德 - 萨 瑟 兰 共同 出 演 。 Hanks, Ton 
了 《 冷 山 》， 而 萨 瑟 兰 和 凯 文 . 贝 肯 一 起 出 演 9 stance 
了 《动物 屋 》。 给 出 演员 名 字 的 情况 下 ， 这 个 本 太后 人 隐伏 
游戏 的 最 简单 的 版 本 是 找到 一 些 交替 的 电影 和 演员 的 序列 ， 可 以 指向 凯 文 . 贝 肯 。 例 如 ， 一 
个 电影 迷 可 能 知道 汤姆 . 汉 克 斯 曾经 和 劳 埃 德 : 布 里 奇 斯 共同 出 演 了 《 魔 岛 仙 踪 》， 而 劳 埃 
德 . 布 里 奇 斯 与 帕特里克 . 艾 伦 共 演 了 《电话 谋杀 娄 》 帕特里克 . 艾 伦 又 与 唐纳德 . 萨 琴 
兰 共 演 了 《 猛 谭 雄 风 》 唐纳德 . 萨 瑟 兰 又 与 凯 文 * 贝 骨 共 演 了 《动物 屋 》。 但 是 这 个 知识 
不 足以 建立 汤姆 汉 克 斯 的 贝 肯 数 (实际 上 他 的 贝 肯 数 是 1， 因 为 他 和 凯 文 * 贝 肯 共 演 了 
《阿波 罗 13 号 ))。 你 可 以 看 到 ， 凯 文 * 贝 肯 数 其 实 就 是 计算 最 短 序列 的 电影 数 ， 所 以 很 难 
确定 有 人 能 够 在 不 使 用 计算 机 的 情况 下 赢得 游戏 。 值 得 注意 的 是 ， 程 序 4.5.3 中 的 
PathFinder 测试 客户 程序 就 是 这 样 一 个 程序 ， 你 需要 找到 一 个 最 短路 径 来 计算 movies.txt 中 
任何 演员 的 凯 文 - 贝 肯 数 一 一 这 个 数 是 距离 的 一 半 (因为 PathFinder 是 路 径 长 度 ， 而 游戏 中 
只 要 电影 数 一 一 译 者 注 )。 你 可 能 会 喜欢 使 用 这 个 程序 ,或 者 扩展 它 来 回答 关于 电影 业务 或 
许多 其 他 领域 的 一 些 娱乐 问题 。 例 如 ， 数 学 家 们 通过 论文 合 著 和 与 20 世纪 多 产 的 数学 家 保 
罗 . 厄 多 斯 的 关系 图 来 玩 这 个 游戏 。 同 样 ， 新 泽 西 州 人 的 布鲁斯 ， 斯 普 林 斯 汀 数 似乎 都 是 
2， 因 为 这 个 州 的 每 个 人 似乎 都 认识 一 个 自称 知道 布鲁斯 的 人 。 

其 他 客户 程序 。,PathFinder 是 一 种 多 用 途 的 数据 类 型 ， 可 以 有 许多 实际 的 用 途 。 例 如 ， 通 
过 为 每 个 顶点 构建 一 个 PathFinder， 可 以 很 容易 地 开发 一 个 处 理 标准 输入 的 任意 源 - 目标 请 求 
的 客户 程序 (参见 练习 4.5.17 )。 旅 行 服务 恰当 使 用 这 种 方法 可 以 非常 高 的 服务 率 处 理 请 求 。 
由 于 该 客户 程序 为 每 个 顶点 建立 一 个 PathFinder (每 个 顶点 可 能 消耗 与 顶点 数量 成 比例 的 内 
存 )， 因 此 内 存 使 用 量 可 能 是 将 其 用 于 大 型 图 的 一 个 限制 因素 。 对 于 设计 原理 相同 但 性 能 要 求 
更 高 的 应 用 ， 可 以 考虑 一 台 互联 网 路 由 器 ， 它 具有 可 用 机 器 之 间 的 连接 图 ， 并 且 必 须根 据 数 
据 包 给 定 的 目的 地 ， 决 定 下 一 站 如 何 传递 数据 才 是 最 佳 选 择 。 要 做 到 这 一 点 ， 它 可 以 建立 一 
个 以 自己 为 源 的 PathFinder ; 然后 ， 为 了 发 送 一 个 数据 包 到 目的 地 w， 它 计算 pfpathTo(w) 并 
将 数据 包 发 送 到 该 路 径 上 的 第 一 个 顶点 一 一 到 w 的 最 短路 径 的 下 二 站。 或者， 中央 权威 机 构 
可 能 会 为 多 个 相关 路 由 器 中 的 每 一 个 建立 一 个 PathFinder 对 象 ， 并 使 用 它们 发 布 路 由 指令 。 
如 何以 高 服务 率 处 理 这 些 请 求 是 互联 网 路 由 器 的 主要 责任 之 一 ;而 最 短路 径 算法 是 该 过 程 
的 关键 部 分 。 
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_v ”队列 内 容 距 JFK 的 距离 
为 距离 1 进行 初始 化 ATL DEN DFW HOU JFK LAS LAX MCO ORD PHX 
JFK 0 





距离 为 ] 





JFK 

JFK ATL 4 
JFK ATL MCO 1 
JFK ATL MCO ORD 2 


ooo 
加 


ATL MCO ORD 

ATL MCO ORD HOU 
MCO ORD HOU 

ORD HOU 

ORD HOU DEN 

ORD HOU DEN DFW 
ORD HOU DEN DFW PHX 


PoPpPppPpPPp 
ffJ TU IO IO IO ID 

口 口 品 Dee 
FF PP PP FF 
PopHippp 


HOU DEN DFW PHX 
DEN DFW PHX 

DEN DFW PHX LAS 
DFW PHX LAS 

PHX LAS 

PHX LAS LAX 
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FJ FJ IN N 和 TY 
NANMNNNN 
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口 口 elD 口 口 
Wu WwW WwW 

FF FF FF 二 
Ppp 
Fu Tu FU FJ Fo IO 


为 距离 4 进行 检测 LAS LAX 2 
LAX ee i 


使 用 广度 优先 搜索 来 计算 图 中 的 最 短路 径 距 离 


最 短路 径 距 离 。 理 解 广 度 优先 搜索 的 第 一 步 是 考虑 计算 从 源 到 其 他 顶点 的 最 短路 径 长 度 
[6837] 的 问题 。 我 们 的 方法 是 计算 并 保存 PathFinder 构造 函数 中 的 所 有 距离 ， 然 后 在 客户 程序 调用 
distanceTo() 时 返回 请 求 的 值 。 要 将 整数 距离 与 每 个 顶点 名 称 关联 起 来 ， 我 们 使 用 一 个 符号 表 : 


ST<String, Integer> dist = new ST<String, Integer>(); 


这 个 符号 表 的 目的 是 为 每 个 顶点 关联 一 个 整数 ， 这 个 整数 是 从 s 到 该 顶点 的 最 短路 径 的 
长 度 (距离 )。 我 们 首先 通过 调用 dist.put(s,0) 把 s 的 距离 置 为 0， 然 后 使 用 以 下 代码 将 s 的 
邻接 顶点 的 距离 设置 为 1: 


for (String v : G.adjacentTo(s)) 
dist.put(v, 1) 


但 是 ,我 们 接 下 来 该 怎么 做 ? 如 果 我 们 盲目 地 将 每 个 邻接 顶点 的 所 有 邻接 顶点 的 距离 设 
置 为 2， 那 么 我 们 不 仅 会 不 必要 地 将 许多 值 设置 两 次 (邻接 项 点 可 能 有 许多 共同 的 邻接 顶点 )， 
而 且 我 们 会 把 s 的 距离 设置 成 2 ( 它 是 每 个 邻接 顶点 的 邻接 项 点 )， 我 们 显然 不 想 要 这 个 结果 。 

解决 这 些 困 难 的 方法 很 简单 : 

。 按照 与 s 的 距离 顺序 考虑 顶点 。 

。 忽略 与 s 的 距离 已 知 的 顶点 。 

为 了 组 织 计 算 ， 我 们 使 用 一 个 FIFO 队列 。 从 队列 中 的 s 开始 ， 我 们 执行 以 下 操作 , 直 
到 队列 为 空 : 
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。 顶点 v 出 队列 。 

。 给 v 的 所 有 未 知 的 邻接 顶点 设置 距离 ， 其 值 比 v 的 距离 大 1。 

。 所 有 未 知 的 邻接 顶点 入 队列 。 

广度 优先 搜索 使 这 些 顶 点 以 到 源 s 的 距离 非 降序 排列 。 在 示例 图 上 追踪 这 个 算法 将 有 
助 于 说 服 你 它 是 正确 的 。 如 何 证 明 广 度 优先 搜索 标记 出 每 个 顶点 v 到 s 的 距离 的 过 程 是 正确 
的 ， 我 们 把 它 留 作 数 学 归纳 的 一 个 练习 ( 见 练习 4.5.12 )。 

最 短路 径 树 。 我 们 不 仅 要 求 最 短路 径 的 长 度 ， 还 要 求 最 短路 径 本 身 。 为 了 实现 
pathTo(0)， 我 们 使 用 一 个 称 为 最 短路 径 树 (short-paths tree) 的 子 图 ， 定 义 如 下 : 

。 将 源 放 在 树 的 根 上 。 

。 处 理 顶 点 v 时 ， 如 果 v 的 邻接 顶点 人 人 队列， 那么 把 它们 放 到 树 中 ， 并 且 每 个 邻接 顶点 

都 用 一 条 边 连 接 到 v。 

由 于 我 们 只 将 每 个 顶点 人 队列 一 次 ， 所 以 这 个 结构 显然 会 是 一 棵 树 : 它 由 根 ( 源 ) 连接 
到 源 的 每 个 邻接 顶点 的 子 树 组 成 。 研 究 这 样 的 树 ， 你 可 以 立即 知道 树 中 每 个 顶点 到 根 的 距离 
与 图 中 源 的 最 短路 径 的 长 度 相同 。 更 重要 的 是 ， 树 中 的 每 条 路 径 都 是 图 中 的 最 短路 径 。 这 一 
观察 非常 重要 ,因为 它 使 我 们 能 够 轻松 地 为 客户 提供 最 短路 径 。 首 先 ， 我 们 维护 一 个 符号 表 ， 
它 将 每 个 顶点 与 它 所 在 的 最 短路 径 上 的 前 一 个 顶点 ( 即 与 源 点 距离 更 近 一 步 的 顶点 ) 相关 联 : 


ST<String, String> prev; 
prev = new ST<String, String>QO; 


对 于 每 个 顶点 w， 我们 希望 把 它 与 从 源 到 w 的 最 
短路 径 上 的 前 一 个 顶点 关联 起 来 。 通 过 广度 优先 搜索 来 
计算 这 个 信息 是 很 容易 的 : 当 我 们 发 现 顶点 w 是 v 的 邻 
接 顶 点 时 我 们 把 w 入 队列 ， 我 们 这 样 做 是 因为 v 是 从 源 
节点 到 w 的 最 短路 径 的 上 一 个 节点 ， 所 以 我 们 可 以 调用 二 更 
prev.put(wv) 来 记录 这 些 信 息 。prev 数据 结构 不 过 是 最 
短路 径 树 的 一 种 表示 : 它 提供 了 从 树 中 每 个 节点 到 其 父 人 人 摧 
节点 的 链接 。 然 后 ， 为 了 响应 客户 程序 从 源 到 v 的 最 短 
路 径 的 请 求 ， 我 们 沿 着 这 个 从 v 开始 的 树 ， 按 照相 反 的 Gen) (eH (oFw) ko 
顺序 遍历 路 径 ， 所 以 我 们 把 遇 到 的 每 个 顶点 推 到 一 个 栈 
上 ， 然 后 给 客户 程序 返回 这 个 栈 ( 它 是 Iterable 型 )。 栈 人 地 
顶 是 源 s; 栈 底 是 v; 并 且 从 s 到 v 的 路 径 上 的 顶点 在 两 “ 父 链接 表 示 
者 之 间 ， 所 以 当 使 用 foreach 语句 中 的 pathTo() 返回 值 。 信和 -Dep 人 Me 
时 ， 客户 程序 得 到 的 就 是 从 s 到 v 的 路 径 。 最 短路 径 树 

广度 优先 搜索 。PathFinder (程序 4.5.4 ) 是 基于 刚 
刚 讨 论 的 思想 的 单 源 最 短路 径 API 的 实现 。 它 使 用 了 两 个 符号 表 : 一 个 用 于 从 源 到 每 个 顶点 
的 距离 ， 另 一 个 用 于 从 源 到 每 个 顶点 的 最 短路 径 上 的 前 一 个 点 。 构 造 函 数 使 用 一 个 FIFO 队 
列 追 踪 已 经 遇 到 的 顶点 (对 于 那些 已 经 确定 其 最 短路 径 但 其 邻接 顶点 尚未 被 检查 的 顶点 ， 队 
列 中 保存 了 它们 的 邻接 顶点 )。 这 个 过 程 被 称 为 广度 优先 搜索 (breadth-first search, BFS)， 因 
为 它 在 图 中 按 层 进行 了 尽 可 能 增 大 宽度 的 搜索 。 相 比 之 下 ， 还 有 一 种 重要 的 图 搜索 方法 被 称 
为 深度 优先 搜索 ( depth-first search)， 它 是 一 种 基于 递归 的 方法 ， 就 像 我 们 在 程序 2.4.5 中 用 
于 处 理 渗 透 的 那 种 递归 方法 ， 这 种 方法 是 尽 可 能 深入 地 对 图 进行 搜索 。 深 度 优先 搜索 倾向 于 





402 途 4 葬 


找到 长 路 径 ; 广度 优先 搜索 可 以 保证 找到 最 短路 径 。 





最 短路 径 树 a 
(与 父 节 点 相连 的 表示 法 ) 栈 的 内 容 
ATL DEN DFW HOU JFK LAS LAX MCO ORD PHX 
LAX 一 目的 地 
JFK ORF ORD ATL DEN PHX JFK JFK ORD 
ATL DEN DFW HOU JFK LAS LAX MCO ORD PHX PHX LAX 
JFK ORF ORD ATL DEN PHX JFK JFK ORD 
ATL DEN DFW HOU JFK LAS LAX MCO ORD PHX ORD PHX LAX 
JFK ORF ORD ATL DEN PHX JFK JFK ORD 路 径 
Hi» 





ATL DEN DFW HOU JFK LAS LAX MCO ORD PHX 
JFK ORF ORD ATL DEN PHX JFK JFK ORD 
De 


源 
使 用 栈 从 最 短路 径 树 中 恢复 路 径 

性 能 。 图 处 理 算法 的 成 本 通常 取决 于 两 个 图 参数 : 顶点 数 矿 和 边 数 已 。 如 在 PathFinder 
中 所 实现 的 ， 宽 度 优先 搜索 所 需 的 时 间 与 输入 大 小 呈 线 性 关系 ,在 最 坏 的 情况 下 与 BlogV 成 
正比 。 为 了 证 明 这 一 点 ， 首 先 要 注意 的 是 ， 外 循环 (while) 至 多 迭代 天 次 ， 每 个 顶点 一 次 ， 
因为 我 们 要 确保 每 个 顶点 最 多 入 队 一 次 ; 然后 可 以 观察 到 内 循环 (for) 在 所 有 和 迭代 中 总 共 迁 
代 至 多 2E 次 ， 因 为 我 们 要 确保 每 个 边 最 多 检查 两 次 ， 连 接 每 个 边 的 两 个 节点 各 一 次 。 在 大 
小 不 超过 六 的 符号 表 上 ， 循环 的 每 次 迭代 至 少 需 要 一 个 contains() 操作 ， 以 及 可 能 两 个 put() 
操作 。 这 个 线性 对 数 时 间 性 能 取决 于 使 用 基于 二 又 搜索 树 的 符号 表 (比如 ST 或 javaiutil. 
TreeMap)， 它 既 有 线性 时 间 的 搜索 ， 也 有 对 数 时 间 的 搜索 和 插入 。 使 用 散 列 表 (如 java.util. 
HashMap) 来 替换 符号 表 能 够 将 输入 大 小 的 运行 时 间 减 少 为 线性 ， 与 典型 图 的 EE 成 比例 。 

邻接 矩阵 表示 。 如 果 没 有 适当 的 数据 结构 ， 图 处 理 算法 有 时 无 法 得 到 高 性 能 的 实现 ， 所 
以 不 应 视 其 为 理所当然 。 例 如 ， 图 还 有 一 种 表示 方法 称 为 邻接 
答 阵 表示 (adjaceficy-matrix representation)， 使 用 符号 表 将 顶 
点 名 称 映 射 到 0 到 天 1 之 间 的 整数 ， 然 后 维护 一 个 VXV 的 
布尔 数组 ， 如 果 存 在 一 个 连接 顶点 i 和 顶点 j 的 边 ， 那 么 数组 
i 行 j 列 的 元 素 就 是 tue， 如 果 不 存 在 这 条 边 ， 则 为 false。 在 
本 书 中 ,我 们 已 经 使 用 了 类 似 的 表示 方法 ， 如 在 1.6 节 中 研究 
用 于 网 页 排序 的 随机 游 走 模型 。 邻 接 和 矩阵 表示 法 很 简单 ， 但 对 
于 大 型 图 来 说 是 不 可 行 的 ， 一 个 具有 百 万 个 顶点 的 图 需要 一 个 
具有 万 亿 个 元 素 的 邻接 和 矩阵。 理解 图 处 理 问 题 的 这 种 区 别 ， 决 
定 了 最 终 是 否 能 够 解决 一 个 实际 问题 。 

广度 优先 搜索 是 一 种 基本 的 算法 ,你 可 以 使 用 这 种 算法 
在 航空 公司 路 线 图 、 城 市 地 铁 系 统 (参见 练习 4.5.38 ) 或 许多 
类 似 的 情况 中 找到 路 线 。 正 如 我 们 在 分 隔 度 的 例子 中 所 表明 的 那样 ， 它 也 被 用 于 无 数 的 其 他 
应 用 ， 从 互联 网 上 的 网 页 、 路 由 数据 包 到 研究 传染 病 、 大 脑 模型 以 及 基因 组 序列 之 间 的 关 
系 。 这 些 应 用 许多 都 涉及 巨大 的 图 ， 所 以 一 个 高 效 的 算法 是 必 不 可 少 的 。 


JFK ORD PHX LAX 





图 的 邻接 矩阵 表示 


日 ” 原 书 是 21， 出 现 得 很 突 无 ， 估 计 是 笔 误 。 一 一 译 者 注 
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程序 4.5.4 “最 短路 径 实现 


public class PathFinder 
dist | 距 s 的 距离 

private ST<String, Integer> dist; 从 s 开 始 的 
private ST<String, String> prev; preoyis 


径 的 前 一 个 节点 
public PathFinder(Graph G, String s) 
全 // 使 用 BFS 计 算 源 顶点 到 图 6 中 的 每 个 其 他 顶 皮 
最短 过 
性 知音 全 TestHj ng，String>0); 
dist = new ST<String, Integer>(O); 图 
Queue<String> queue = new Queue<String>(); 源 
queue.enqueue(s); js % 
dist.put(s, 0); 顶点 队列 
while (!queue.isEmptyO)) 当前 顶点 
{， ”人 外 理 队列 中 的 下 二 个 顶点 v 的 邻接 项 点 
String v = queue. dequeue(); 
for (String w : G.adjacentTo(v)) 
{ // 检查 距离 是 否 已 知 
if (!dist.contains(w)) 
{ / 添加 到 队列 中 ; 保存 最 短路 径 信 息 
queue .enqueue(Cw) ; 
dist.put(w, 1 + dist.get(v)); 


prev.put(w, Vv); 
PathFinder() | G 中 s 的 构造 函数 量 
distanceTo() | 从 s 到 v 的 距离 | 
E pathTo() “| 从 s 到 v 的 路 径 


public int distanceTo(String V) 
{ return dist.get(v); } 


public Iterable<String> pathTo(String v) 
{ 从 s 到 Vv 的 最 短路 径 上 的 顶点 
Stack<String> path = new Stack<String>(); 
while (v != null && dist.contains(v)) 
{ /当前 顶点 入 队 ; 移动 到 路 径 上 的 前 一 个 顶点 
path.push(v); 
Vv = prev.get(v); 


return path; 





这 个 类 使 用 广度 优先 搜索 来 计算 从 特定 源 顶 点 s 到 图 G 中 每 个 顶点 的 最 短 
路 径 。 请 参阅 程序 4.5.3 中 的 示例 客户 程序 。 





最 短路 径 问 题 的 一 个 重要 推广 是 为 每 个 边 设置 权重 (可 以 表示 距离 或 时 间 )， 并 寻求 找 
到 边 的 权重 总 和 最 小 化 的 路 径 。 如 果 你 接 下 来 学 习 算 法 或 者 运筹 学 ， 你 将 会 学 到 广度 优先 搜 
索 的 一 个 通用 算法 一 一 Dijkstra 算法 ， 它 可 以 在 线性 时 间 内 解决 这 个 问题 。 当 你 从 GPS 设备 
或 网 络 上 的 地 图 应 用 程序 获取 路 线 时 ，Dijkstra 算法 是 解决 相关 最 短路 径 问 题 的 基础 。 这 些 
重要 并 且 常 见 的 应 用 程序 只 是 冰山 一 角 ， 因 为 图 模型 比 地 图 要 普遍 得 多 。 
小 世界 图 科学 家 已 经 确定 了 一 类 特别 有 趣 的 图 ， 被 称 为 小 世界 图 (small-world 
graphs)， 它 出 现在 自然 科学 和 社会 科学 的 众多 应 用 中 。 小 世界 图 由 以 下 三 个 属性 表征 : 
。 稀 玻 性 : 边 的 数量 远 小 于 图 中 顶点 数 可 以 对 应 的 边 的 总 数 (图 中 任意 两 个 顶点 就 能 对 
应 一 条 边 ， 因 此 项 点数 决定 了 整个 图 中 可 以 包含 的 边 数 的 上 限 ， 稀 下 图 就 是 指 图 中 存 
在 的 边 数 远 小 于 这 个 上 限 的 图 一 一 译 者 注 ) 。 
。 平均 路 径 长 度 较 短 : 如 果 选 取 两 个 随机 顶点 ， 则 它们 之 间 的 最 短路 径 的 长 度 很 短 。 
。 它们 呈现 局 部 聚集 : 如 果 有 两 个 顶点 同时 是 同一 个 顶点 的 邻接 顶点， 那么 这 两 个 顶点 
很 可 能 是 彼此 的 邻接 顶点 。 
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我 们 将 具有 这 三 种 属性 的 图 统称 为 呈现 了 小 世界 现象 (small world phenomenon ) 。 “小 
世界 ”这 个 术语 指 的 是 多 数 顶 点 既 有 局 部 聚集 ， 又 有 到 其 他 顶点 的 短路 径 。“ 小 世界 现象 ” 
这 个 词 指出 这 样 一 个 意 想 不 到 的 事实 ， 即 在 实践 中 出 现 的 很 多 图 都 是 稀疏 的 ， 呈 现 局 部 聚 
集 ， 并 且 路 径 很 短 。 除 了 刚刚 考虑 的 社交 关系 应 用 之 外 , 小 世界 图 已 被 用 于 研究 产品 或 想法 
的 营销 、 时 尚 的 形成 和 传播 、 互 联网 的 分 析 、 安 全 的 端 对 端 网 络 的 构建 、 路 由 算法 和 无 线 网 
络 的 发 展 、 电 网 的 设计 、 人 脑 信 息 处 理 的 建 模 、 振 荡 器 中 相 变 的 研究 、 病 毒 感染 (在 生物 体 
和 计算 机 中 ) 的 传播 等 应 用 。 从 20 世纪 90 年 代 沃 欧 和 斯 特 罗 加 茨 的 开创 性 工作 开始 ， 人 们 
对 小 世界 现象 进行 了 大 量 的 研究 。 

这 样 的 研究 中 的 一 个 关键 问题 如 下 : 给 出 一 个 图 ， 我 们 如 何 判 断 它 是 否 是 一 个 小 世界 
图 ? 为 了 回答 这 个 问题 ,我 们 首先 增加 一 个 条 件 ， 就 是 这 个 图 是 不 小 的 (比如 ， 它 有 1000 
个 顶点 或 更 多 )， 并 且 它 是 连通 的 〈 存 在 连接 每 对 顶点 的 路 径 )。 然 后 六 我 们 需要 为 每 个 小 世 
界 属 性 设置 具体 的 阔 值 : 

。 黎 下 性 是 指 平均 顶点 的 度 小 于 201lgV。 

。 平均 路 径 长 度 较 短 是 指 两 个 顶点 之 间 最 短路 径 的 平均 长 度 小 于 10lgV。 

。 对 于 局 部 聚集 ， 我 们 规定 一 个 术语 聚集 系数 (clustering coefficient)， 小 世界 的 聚集 系 

数值 应 大 于 10%。 

局 部 聚集 的 定义 比 稀 玻 性 和 平均 路 径 长 度 的 定义 稍微 复杂 一 些 。 直 观 地 说 ， 项 点 的 聚集 
系数 表示 的 是 : 随机 选取 一 个 顶点 的 两 个 邻接 顶点 ， 这 两 者 之 间 被 一 条 边 连接 起 来 的 概率 。 
更 确切 地 说 ， 如 果 一 个 顶点 有 个 邻接 项 点 ， 那么 有 t(t-1)/2 条 边 连 接 这 些 邻 接 顶 点 ， 局 部 
聚集 系数 指 的 就 是 这 些 边 所 占 比例 。 当 顶点 度 为 1 或 0 时 ,其 局 部 聚集 系数 为 0。 图 的 聚集 
系数 ( clustering coefficient of a graph) 是 其 顶点 的 局 部 聚集 系数 的 平均 值 。 如 果 这 个 平均 值 
大 于 10%， 我 们 就 说 这 个 图 形 是 局 部 聚集 的 。 下 图 计算 了 一 个 小 型 图 的 这 三 个 值 。 








平均 顶点 度数 平均 路 径 长 度 聚集 系数 
顶点 度 顶 二 (= re 连接 过 
TE 页 点 对 最短 路径 长 度 顶点 ” 度 “实际 数 可 能 数 
Nb A 1 A 小 3 6 
8 3 NC eA Bi 3 
5 3 FT 1 3 2 3 
6 2 A_H A-H 1 Ge 1 1 
ee 区 和 1 1 
总 数 “14 六 
平均 度数 = ] =2.8 BH ~ B-H 1 36 2/34213+1/1 FH/ 到 村 
CG Cc-G 1 i 四 
CH Ny 
OO 9 次 风疹 2 
Ch 和 数 -5 长 度 癌 数 13 
(8) (©) 顶点 对 的 个 数 10 
计算 小 世界 图 的 特征 


为 了 更 好 地 熟悉 这 些 定义 ， 我 们 接 下 来 定义 一 些 简单 的 图 模型 ， 并 检查 它们 是 否 具备 这 
三 个 必要 的 属性 以 描述 小 世界 图 。 ; 

完全 图 。 具 及 个 顶点 的 完全 图 ( complete graph) 具有 V(V-1)/2 条 边 ， 每 条 边 连接 每 对 顶 
点 。 完 全 图 不 是 小 世界 图 。 它 们 的 平均 路 径 长 度 较 短 (每 条 最 短路 径 长 度 为 1 )， 它 们 表现 出 局 部 
聚集 (聚集 系数 为 1 )， 但 它们 并 不 稀 朴 (平均 顶点 度数 为 关 1， 对 于 较 大 的 大 远大 于 20lg7)。 
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轮 环 图 。 轮 环 图 (ring graph) 是 和 个 顶点 均匀 地 分 布 在 一 个 圆 的 圆周 上 ， 每 个 顶点 都 连 
接 到 其 两 侧 的 邻接 顶点 。 在 大 阶 环 图 (krring graph) 中 ， 每 个 顶点 都 与 其 两 边 的 上 个 最 近邻 
接 顶 点 邻接 。 下 图 展示 了 一 个 有 16 个 顶点 的 二 阶 环 图 。 轮 环 图 也 不 是 小 世界 图 。 例 如 ， 二 
阶 环 图 是 稀 玻 的 (每 个 顶点 具有 度数 4) 并 且 是 局 部 聚集 的 (聚集 系数 是 /2 )， 但 是 它们 的 
平均 路 径 长 度 并 不 短 (参见 练习 4.5.20 ) 。 

随机 图 。Erd5s-Renyi 模型 是 生成 随机 图 (random graph) 的 一 个 模型 ， 已 经 得 到 深入 的 
研究 。 在 这 个 模型 中 ,我 们 通过 概率 为 P 的 边 连接 V 个 顶点 以 建立 随机 图 。 具 有 足够 数量 
的 边 的 随机 图 看 起 来 很 像 是 连通 的 ， 并 且 平 均 路 径 长 度 较 短 ， 但 它们 不 是 小 世界 图 ， 因 为 它 
们 不 是 局 部 聚集 的 (参见 练习 4.5.46 )。 

完全 图 二 阶 环 图 随机 图 


Ee 


ZZ BN 
和 很 多 最 短路 径 SS 


过 长 ,例如 从 
这 点 到 这 点 








PPV- 没有 局 部 
过 多 的 边 聚集 特性 


三 个 图 模型 
和 是 否 局 


这 些 例子 说 明 ， 开 发 同时 满足 所 有 三 个 属性 的 。 名 a 蝇 引 径 
图 模型 是 一 个 令 人 困惑 的 挑战 。 花 点 时 间 尝 试 设计 一 是否 较 短 ? 部 来 类 ? 
个 你 认为 可 以 满足 的 图 模型 。 在 思考 这 个 问题 之 后 ， 完全 图 ”9 oy 和 
你 会 意识 到 你 可 能 需要 一 个 程序 来 帮助 计算 。 另 外 ， “二 阶 环 图 “全 0 wa 

你 可 能 也 意识 到 ， 在 实践 中 能 够 经 常 发 现 这 样 的 图 是 ” 随 J 图 eS ® 站 
相当 令 人 惊讶 的 。 事 实 上 ， 你 可 能 也 想 知道 任意 的 一 图 模型 的 小 世界 属性 

个 图 是 不 是 小 世界 图 ! 

其 实 我 们 的 限定 条 件 是 有 一 些 主观 成 分 的 ， 如 聚集 阔 值 选择 10% 而 不 是 某 个 其 他 固定 
的 百分比 ， 以 及 稀疏 性 阔 值 选择 20lgF、 短 路 径 阔 值 选 择 101gV 等 ， 但 是 我 们 通常 不 会 接近 
这 些 边界 值 。 例 如 ， 考 虑 网 页 图 ( web graph)， 其 中 每 个 网 页 都 是 一 个 顶点 ， 并 且 如 果 两 个 
页 面 之 间 有 链接 ， 那 就 用 一 条 边 连 接 这 两 个 顶点 。 科 学 家 估计 ， 从 一 个 网 页 到 达 另 一 个 网 页 
需要 的 点 击 次 数 很 少 会 超过 30。 由 于 网 页 数量 达到 数 十 亿 ， 这 个 估计 意味 着 平均 路 径 长 度 
非常 短 ， 远 低 于 我 们 的 101gy 阐 值 (对 于 十 亿 个 顶点 ， 这 将 约 为 300 )。 

在 定义 之 后 ， 测 试图 是 否 是 小 世界 图 仍然 是 一 个 重要 的 计算 负担 。 像 你 可 能 怀疑 过 的 
那样 ， 我 们 一 直 在 考虑 的 图 处 理 数据 类 型 正好 可 以 用 来 开发 我 们 需要 的 工具 。SmallWorld 
(程序 4.5.5 ) 是 一 个 Graph 和 PathFinder 的 客户 程序 ， 实 现 了 这 些 测试 。 如 果 没 有 我 们 已 经 
考虑 过 的 有 效 的 数据 结构 和 算法 ， 这 个 计算 的 成 本 就 会 过 高 。 即 便 如 此 ， 对 于 大 型 图 (如 
movies.txt)， 我 们 也 必须 借助 于 统计 抽样 ， 才 能 在 合理 的 时 间 内 估计 平均 路 径 长 度 和 聚集 系 
数 (参见 练习 4.5.44 )， 因 为 函数 averagePathLengthO0 和 clusteringCoefficient() 需要 平方 量 
级 时 间 。 
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程序 4.5.5 ”小 世界 测试 


public class SmallWorld 












public static double ee GO) 
{ return 2.0 * G.EQO / G.VO; 


public static double averagePathLength(Graph G) 
{ /1 计算 平均 顶点 焉 离 



















int sum = 0; 6 图 
for (String v : G.vertices()) Ed 顶点 之 间距 离 的 累 
{ HH 加 入 到 踊 Yy 的 边 长 的 总 和 中 加 和 


PathFinder pf = new PathFinder(G, Vv); vy 顶点 迭代 器 变量 
for (String w : G.vertices()) 全 > 
v 的 邻接 项 点 


sum += pf.distanceTo(w); 


} 
return (double) sum / (G.VO * (G.VO - D); 


public static Ub clusteringCoefficient(Graph G) 
{ W 计算 聚集 系数 
int total = 0; 
for (CString Vv : G.vertices(O)) 
{2 WA 棱 积 4 夺 点 V 的 局 部 聚集 系数 
int dssib1e = G.degree(v) * (G.degree(v) - 1); 
int actual = 0; 
for (String u : G.adjacentTo(v)) 










for (String w : G.adjacentTo(v)) G 
if (G.hasEdge(u, w)) actual++; ER 更 可 能 的 局 部 边 的 
if (possible > 0) 累积 总 和 
total += 1.0 * actual / possible; 文责 二 人 二 
} actual 计 总 和 
return (double) total / G.VO; a 顶点 迭代 器 恋 量 
v 的 邻接 顶点 








public static void main(String[] args) 
{ /参见 练习 4.5.24x/ 







这 个 客户 程序 从 标准 输入 读 取 一 个 图 ， 并 计算 图 的 各 种 参数 的 值 ， 以 测 
试 该 图 是 否 呈 现 出 小 世界 现象 。 








% java SmallWorld "/”tinyGraph .txt 
5 vertices，7 edges 

average degree = 2.800 
average path length = 1.300 
clustering coefficient = 0.767 








一 个 经 典 的 小 世界 图 。 我 们 的 电影 -演员 图 不 是 一 个 小 世界 图 ， 因 为 它 是 个 三 部 图 ， 因 
此 聚集 系数 为 0。 男 外 ， 一 些 演员 之 间 没 有 任何 路 径 相互 连接 。 然 而 ， 如 果 两 个 演员 同时 出 
现在 同一 部 电影 中 ， 则 将 其 连接 在 一 起 ， 这 样 就 可 以 得 到 一 个 更 简单 的 演员 -= 演员 图 , 它 就 
是 一 个 典型 的 小 世界 图 (在 丢弃 那些 没有 连接 到 凯 文 * 贝 肯 的 演员 后 )。 下 图 说 明了 与 一 个 
小 型 的 电影 - 演员 列表 文件 相对 应 的 电影 - 演员 图 和 演员 - 演员 图 。 


电影 -演员 列表 文件 电影 -演员 图 演员 -演员 图 


% more tinyMovies .txt 

Movie 1/Actor A/Actor B/Actor H 
Movie 2/Actor B/Actor C 

Movie 3/Actor A/Actor C/Actor G 





电影 - 演员 列表 文件 的 两 种 不 同 的 图 表示 
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Performer (程序 4.5.6 ) 是 一 个 从 电影 - 演员 列表 输入 格式 的 文件 创建 演员 -演员 图 的 
程序 。 电 影 = 演员 列表 文件 中 的 每 一 行 由 一 个 电影 组 成 ， 后 面 跟着 所 有 出 现在 该 电影 中 的 演 
员 ， 由 和 斜 线 分 隔 。 Performer 增加 了 连接 出 现在 该 电影 中 的 每 对 演员 的 边 。 对 输入 中 的 每 个 A 
电影 执行 此 操作 会 根据 需要 生成 连接 演员 的 图 。 697 


程序 4.5.6 ”演员 -演员 图 
public class Performer 


public static void main(String[] args) 


图 
String filename = args[0]; in 一 | 输入 流 
String delimiter = args[1]; Tine | 电影 -演员 列表 文件 的 一 行 
Graph G = new Graph(); names[] | 电影 和 演员 名 称 


In in = new In(filename); i, j | 两 个 演员 的 索引 
while (in.hasNextLine()) ” 


String line = in,.readLine(); 
String[] names = line.split(delimiter); 
for (int i = 1; i < names.length; i++) 
for (int j = i+l; j < names.length; j++) 
G.addEdge(names[i], names[j]); 
} 


double degree = SmallWorld.averageDegree(Q); 

double length = SmallWorld.averagePathLength(GO); 

double cluster = SmallWorld.clusteringCoefficient(G); 
StdOut.printf("number of vertices = %7d\n", G.VO); 
StdOut.printf("average degree = %7.3f\n", degree); 
StdOut.printf("average path length = %7.3f\n", length); 
StdOut.printf("clustering coefficient = %7.3f\n", cluster); 











该 程序 是 一 个 SmallWorld 的 客户 程序 ， 它 将 电影 -演员 列表 的 文件 名 和 分 
隔 符 作为 命令 行 参数 ， 并 创建 关联 的 演员 -演员 图 。 它 将 图 的 项 点 数 、 平 均 度 
数 、 平 均 路 径 长 度 和 聚集 系数 打印 到 标准 输出 。 它 假定 演员 -演员 图 是 连通 
的 (参见 练习 4.5.29 ) ， 以 便 定义 平均 路 径 长 度 售 。 


% java Performer tinyMovies.txt "/" % java Performer moviesG.txt "/" 
number of vertices = number of vertices = 19044 

average degree = “2.800 average degree = 148.688 
average path length = 1.300 average path length = 3.494 
clustering coefficient = 0.767 clustering coefficient = 0.911 


由 于 演员 - 演员 图 通常 具有 比 相应 的 电影 - 演员 图 更 多 的 边 ， 所 以 我 们 将 使 用 来 自 文件 
moviesG.txt 的 小 型 演员 = 演员 图 来 进行 处 理 ， 其 包含 1261 个 G 级 电影 和 19 044 个 演员 (全 部 
连接 到 凯 文 * 贝 肯 )。 现 在 ，Performer 告诉 我 们 ， 与 moviesG.txt 相关 的 演员 -演员 图 有 19 044 
个 顶点 和 1 415 808 条 边 ， 所 以 平均 顶点 度数 为 148.7 (大 约 是 201g 三 284.3 的 一 半 )， 这 意味 
着 它 是 稀 朴 的 ; 其 平均 路 径 长 度 为 3.494 (和 远 低 于 10lg 太 142.2 )， 所 以 路 径 较 短 ; 其 聚集 系数 
为 0.911， 因 此 具有 局 部 聚集 。 我 们 找到 了 一 个 小 世界 图 ! 这 些 计 算 验 证 了 这 种 社会 关系 图 可 
以 表现 出 小 世界 现象 。 鼓 励 你 查找 其 他 真实 世界 的 图 ， 并 使 用 SmallWorld 对 其 进行 测试 。 


日 原 书 上 是 average page length， 感 觉 像 是 笔 误 。 一 一 译 者 注 
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一 种 理解 小 世界 现象 的 方法 是 开发 一 个 数学 模型 ， 我 们 可 以 用 它 来 检验 假设 和 做 出 预 
测 。 最 后 ， 我 们 回 到 如 何 生成 一 个 图 模型 的 问题 上 ， 这 个 模型 可 以 帮助 我 们 更 好 地 理解 小 世 
界 现象 。 找 到 一 个 这 种 模型 的 取 巧 方法 是 组 合 两 个 稀 琉 图 : 一 个 二 阶 轮 环 图 (具有 较 高 的 聚 
集 系 数 ) 和 一 个 随机 图 (具有 较 小 的 平均 路 径 长 度 )。 

具有 随机 捷径 的 轮 环 图 。 沃 蒋 和 斯 特 罗 加 茨 的 工作 中 揭示 的 最 令 人 惊讶 的 事实 之 一 是 ， 
将 相对 少量 的 随机 边 添加 到 具有 局 部 聚 类 的 稀 下 图 中 会 产生 一 个 小 世界 图 。 为 了 深入 了 解 为 
什么 会 出 现 这 种 情况 ， 可 以 考虑 一 个 二 阶 轮 环 图 ， 其 中 直径 (最 远 的 一 对 顶点 之 间 的 路 径 长 
度 ) 为 一 V4 ( 见 下 图 )。 增 加 一 个 连接 最 远 顶 点 的 边 后 ， 直 径 减 小 到 一 V8 ( 见 练习 4.5.21 )。 
将 V/2 个 随机 “捷径 ” 边 添加 到 二 阶 环 图 中 极 有 可 能 显著 降低 平均 路 径 长 度 ， 使 其 成 为 对 数 
级 (请 参见 练习 4.5.25 )。 而 且 ， 这样 做 将 平均 度数 仅 提 高 了 1， 并 且 没 有 将 聚集 系数 降低 到 
远 低 于 1/2。 也 就 是 说 ， 具 有 V2 条 “捷径 ”的 二 阶 环 图 很 可 能 是 一 个 小 世界 图 ! 


有 正 对 边 的 二 环 图 有 随机 捷径 的 二 环 图 








一 个 新 的 图 模型 


依据 这 些 模型 创建 图 的 生成 器 是 很 容易 开发 的 ， 我 们 可 以 使 用 SmallWorld 来 确定 图 是 
否 展现 出 小 世界 现象 ( 见 练习 4.5.24 )。 我 们 还 可 以 验证 我 们 为 tinyGraph.txt 的 简单 图 、 完 
全 图 或 轮 环 图 导出 的 分 析 结 果 。 然 而 ， 与 大 多 数 科 学 研究 一 样 ， 我 们 在 回答 旧 的 问题 的 同时 
出 现 了 新 的 问题 。 我 们 需要 添加 多 少 条 随机 “捷径 ”才能 获得 较 短 的 平均 路 径 长 度 ? 随机 连 
接 图 中 的 平均 路 径 长 度 和 聚集 系数 是 多 少 ? 还 有 哪些 其 他 的 图 模型 可 能 适合 于 研究 ? 精确 地 
估计 一 个 大 型 图 中 的 聚集 系数 或 者 平均 路 径 长 度 需要 多 少 样本 ? 你 可 以 在 练习 中 找到 很 多 解 
决 这 些 问 题 的 建议 ， 并 进一步 调研 小 世界 现象 。 借 助 本 书 开发 的 基本 工具 和 编程 方法 ， 你 可 
以 很 好 地 解决 这 些 以 及 很 多 其 他 的 科学 问题 。 

经 验 总 结 ”这 个 案例 研究 说 明了 算法 和 数据 结构 在 科学 研究 中 的 重要 性 。 这 也 强化 了 我 
们 在 本 书 中 学 到 的 一 些 值 得 重复 说 明 的 经 验 教训 。 

仔细 设计 你 的 数据 类 型 。 在 本 书 中 ， 我 





模型 平均 度数 ”平均 路 径 长 度 ” 聚集 系数 
们 长 久 坚持 的 理念 之 一 就 是 ， 有 效 的 编程 来 二 
自 于 对 数据 类 型 可 能 取 值 的 集合 以 及 在 这 些 完全 图 O © @ 
值 上 定义 的 操作 集合 的 精确 理解 。 使 用 像 二 & 7 
Java 这 样 的 面向 对 象 的 现代 编程 语言 为 我 们 Se 二 
提供 了 理解 的 途径 ， 因 为 我 们 设计 、 构 建 和 ”p=10/r 的 随机 连接 图 @ © O 
使 用 我 们 自己 的 数据 类 型 。 我 们 的 Graph 数 。 县 有 je 条 随机 ' 捷 。 5 5.71 0.343 
据 类 型 是 一 个 基本 的 数据 类 型 ， 是 很 多 和 迭 代 ”和合 的 - 阶 8 图 得 gy 


以 及 我 们 讨论 过 的 设计 经 验 的 产物 。 我 们 客 ”具有 1000 个 顶点 的 不 同 种 类 的 图 的 小 世界 参数 
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户 程序 代码 清晰 和 简单 ， 证 明了 在 任何 程序 中 认真 对 待 基 本 数据 类 型 的 设计 和 实现 的 价值 。 

逐步 开发 代码 。 与 我 们 所 有 其 他 案例 研究 一 样 ， 我 们 一 次 构建 一 个 软件 模块 ， 在 转 到 下 
一 个 模块 之 前 测试 和 学 习 每 个 模块 。 

在 解决 未 知 问题 之 前 解决 你 能 理解 的 问题 。 我 们 在 几 个 城市 之 间 设 计 航 线 的 最 短路 线 的 
示例 是 一 个 很 容易 理解 的 简单 示例 ， 但 又 足够 复杂 到 能 够 引起 我 们 的 兴趣 ， 以 便 坚 持 调试 和 
追踪 路 径 ， 又 不 会 复杂 到 使 这 些 任 务 变 得 太 繁 重 。 

持续 测试 并 检查 结果 。 当 调用 处 理 大 量 数据 的 复杂 程序 时 ， 你 一 定 要 仔细 地 检查 结果 ， 并 
使 用 常识 来 评估 程序 产生 的 每 一 个 输出 。 新 手 程 序 员 会 怀 有 乐观 的 心态 (“如 果 程 序 产 生 了 答 
案 ， 它 肯定 是 正确 的 ”); 有 经 验 的 程序 员 却 怀揣 着 悲观 的 心态 (“这 个 结果 肯定 有 什么 问题 ”)。 

使 用 真实 世界 的 数据 。 网 络 电影 数据 库 ( Internet Movie Database) 中 的 movies.txt 文件 
只 是 数据 文件 的 一 个 例子 ， 互 联网 上 存在 大 量 这 样 的 数据 。 在 过 去 ， 这 样 的 数据 经 常 被 隐藏 
为 私 用 或 专 有 格式 ， 但 是 如 今 大 多 数 人 意识 到 简单 的 文本 格式 才 是 首选 。Java 的 String 数 
据 类 型 中 的 各 种 方法 使 得 处 理 真 实数 据 变 得 容易 ， 因 此 也 可 以 用 来 模拟 现实 世界 中 的 各 种 现 
象 。 刚 开始 使 用 时 ， 建 议 使 用 真实 世界 格式 的 小 型 文件 ， 以 便 在 处 理 大 型 文件 之 前 测试 程序 
的 正确 性 ， 并 获得 性 能 信息 。 

软件 复 用 。 本 书 中 我 们 持久 坚持 的 男 一 个 理念 是 ， 有 效 的 编程 基于 对 我 们 可 用 的 基本 数 
据 类 型 的 理解 ， 所 以 我 们 不 必 为 了 基本 功能 而 重 写 代码 。 我 们 在 Graph 中 使 用 ST 和 SET 是 
一 个 很 好 的 例子 一 一 很 多 程序 员 仍然 使 用 图 的 低级 表示 和 实现 ， 这 些 实现 方法 使 用 链表 或 数 
组 表示 图 ， 这 意味 着 他 们 必须 为 任何 简单 的 操作 都 要 再 写 一 遍 代码 ， 比 如 维护 和 遍历 链表 。 





我 们 的 最 短路 径 类 PathFinder 使 用 了 Graph、ST、SET、Stack 和 Queue 一 一 襄 括 了 几乎 所 
有 的 基本 数据 结构 。 
保持 灵活 性 。 重 复 使 用 软件 通常 意味 着 使 用 各 种 Java 库 中 





的 类 。 这 些 类 的 接口 通常 非常 宽泛 〈( 即 它们 包含 很 多 方法 )， 因 
此 ， 即 使 你 的 实现 都 是 Java 库 方法 的 调用 ， 定 义 和 实 现 自 己 的 
API 以 及 定义 客户 程序 和 实现 之 间 的 狭窄 接口 总 是 明智 的 。 这 
种 方法 提供 了 灵活 性 ， 这 样 你 就 可 以 在 有 保证 的 情况 下 切换 到 人 (oD 
更 有 效 的 实现 ， 并 避免 依赖 对 库 中 自己 不 使 用 的 部 分 的 更 改 。 
例如 ， 在 我 们 的 Graph 实现 (程序 4.5.1) 中 使 用 ST 使 我 们 (Ger) Csr ) 
能 够 灵活 地 使 用 我 们 的 任何 符号 表 实现 (如 HashST 或 BST)， 
或 是 可 以 灵活 使 用 Java 的 符号 表 实 现 (java.util.TreeMap 和 PathFinder 的 代码 复 用 
java.util.HashMap )， 而 不 必 更 改 Graph。 

性 能 影响 。 如 果 没 有 好 的 算法 和 数据 结构 ， 本 章 的 许多 问题 就 无 法 被 解决 ， 因 为 很 多 初 
级 的 简单 方法 需要 的 时 间 和 空间 消耗 是 难以 忍受 的 。 估 算 我 们 程序 的 资源 需求 是 设计 中 非常 
重要 的 一 环 。 

这 个 案例 研究 是 本 章 的 完美 收 官 ， 因 为 它 很 好 地 说 明了 我 们 所 考虑 的 方案 是 一 个 起 点 ， 
而 不 是 一 个 完整 的 研究 。 到 目前 为 止 ， 我 们 已 经 介绍 的 编程 技巧 也 是 一 个 起 点 ， 对 于 你 在 科 
、 数 学 、 工 程 学 或 任何 计算 起 着 重要 作用 的 研究 领域 (现在 几乎 是 任何 领域 ) 的 深入 研究 而 
， 都 是 一 个 起 点 。 编 程 方法 和 你 在 这 里 学 到 的 工具 应 该 为 你 解决 任何 计算 问题 做 好 了 准备 。 

在 对 现代 编程 语言 有 了 了 解 和 信心 后 ， 你 肯定 已 准备 好 独立 地 去 思考 和 计算 。 这 些 可 以 

把 你 引入 计算 的 新 境界 ， 就 是 在 未 来 ， 无 论 你 遇 到 什么 样 的 计算 问题 ， 它 们 都 一 定 会 对 你 很 
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有 帮助 。 接 下 来 ， 我 们 开始 这 个 旅程 。 
问答 环节 
问 : 给 定 严 个 顶点 ， 请 问 存 在 有 多 少 个 不 同 的 图 ? 


答 : 假设 没有 自 环 或 平行 边 ， 就 有 V(V-1)/2 条 可 能 的 边 ， 每 条 边 可 以 存在 或 不 存在 ， 
所 以 总 和 为 2 2 。 这 个 数值 呈 指 数 级 增长 ， 如 下 表 所 示 : 


V 1 2 5 6 4 8 光 
2 1 2 8 64 1024 32768 2097152 268435 456 68 719 476 736 


这 些 巨大 的 数字 表明 了 社会 关系 的 复杂 性 。 例 如， 在 街 上 ， 你 只 考虑 从 此 刻 开 始 你 遇见 
的 9 个 人 ， 他 们 相互 认识 的 可 能 性 就 超过 68 万 亿 ! 

问 : 一 个 图 中 是 否 可 以 有 一 个 顶点 不 与 图 中 的 任何 顶点 相 邻 ? 

答 : 好 问题 。 这 样 的 顶点 被 称 为 孤立 顶点 (isolated vertices)。 我 们 的 实现 中 是 不 允许 它 
们 存在 的 。 其 他 实现 若 提供 了 通过 addvertex() 方法 来 实现 显 式 地 添加 一 个 顶点 的 操作 ， 则 
允许 孤立 项 点 的 存在 。 

问 : 为 什么 不 对 每 个 顶点 的 邻接 顶点 只 使 用 链表 的 表示 ? 

答 : 你 可 以 这 样 做 , 但 是 当 你 发 现 需 要 大 小 、 和 迭代 器 等 时 ， 你 很 可 能 会 重新 实现 基本 链 
表 的 代码 。 

问 : 为 什么 VO 和 E() 查询 方法 需要 用 常数 时 间 实 现 ? 

答 : 或 许 大 多 数 客户 程序 只 会 调用 一 次 这 样 的 方法 ,但 是 也 可 能 出 现 如 下 代码 : 

for (int i = 0; i < G.EQ; i++) 

a 

若 你 偷懒 使 用 一 个 算法 来 计算 边 的 数量 而 非 通 过 维护 一 个 实例 变量 来 计算 边 的 数量 ,你 
将 需要 花费 平方 级 的 时 间 。 详 见 练习 4.5.1。 

问 : 为 什么 Graph 和 PathFinder 在 不 同 的 类 中 ? 在 Graph API 中 包含 PathFinder 方法 是 
否 更 有 意义 ? 

答 : 找到 最 短路 径 只 是 众多 图 处 理 问题 之 一 。 如 果 将 所 有 这 些 都 包含 在 一 个 API 中 ， 
这 将 是 一 个 糟糕 的 软件 设计 。 请 重新 阅读 3.3 节 关 于 宽 接 口 的 讨论 。 


练习 


4.5.1 把 返回 图 中 顶点 和 边 的 数量 的 VO 和 EO 实现 分 别 添加 到 Graph 中 。 确 保 你 的 实现 需要 常数 时 
间 。 提 示 : 对 于 VO， 你 可 能 会 假设 ST 中 的 size0) 方法 需要 常数 时 间 ; 对 于 E()， 维护 一 个 实 
例 变量 来 保存 图 中 边 的 当前 数量 。 

4.5.2 ”给 Graph 添加 一 个 方法 degree()， 它 接收 一 个 字符 串 参 数 并 返回 指定 顶点 的 度数 。 使 用 此 方法 
可 查找 文件 movies.txt 中 哪个 演员 在 电影 中 出 现 得 最 多 。 
答案 : 
public int degree(String v) 

if (st.contains(v)) return st.get(v).size(); 


else return 0; 


} 


4.5.9 


4.5.10 


4.5.11 


4.5.12 
4.5.13 


4.5.14 
4.5.15 


4.5.16 


4.5.17 


4.5.18 


4.5.19 


4.5.20 
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为 Graph 添加 一 个 方法 hasVertex()， 它 接收 一 个 字符 串 参 数 ， 如 果 这 个 字符 串 与 图 中 顶点 名 称 
相同 ， 则 返回 true， 否 则 返回 false。 
为 Graph 添加 一 个 方法 hasEdge()， 它 接收 两 个 字符 串 参 数 ， 如 果 它 们 在 图 中 确定 了 边 ， 则 返回 
true， 和 否则 返回 false。 
为 Graph 创建 一 个 拷贝 构造 函数 ， 将 图 G 作为 参数 ， 然 后 创建 并 初始 化 一 个 新 的 独立 副本 。 图 
G 将 来 的 任何 变化 都 不 会 影响 新 创建 的 图 。 
编写 支持 显 式 顶点 创建 的 Graph 版 本 ， 并 人 允许 自 环 、 平 行 边 和 孤立 顶点 。 提示 : 为 邻接 顶点 列 
表 使 用 Queue 而 不 是 SET。 
为 Graph 添加 一 个 remove() 方法 ， 该 方法 接收 两 个 字符 串 参 数 ， 并 从 图 中 删除 指定 的 边 (如 果 
存在 的 话 )。 
给 图 添加 一 个 方法 subgraph()， 它 以 SET<String> 为 参数 ， 并 返回 导出 子 图 (该 图 包含 了 所 有 指 
定 项 点 ， 以 及 原 图 中 两 个 顶点 都 在 指定 顶点 集合 中 的 所 有 的 边 )。 
编写 一 个 支持 可 比较 的 泛 型 顶点 类 型 的 Graph 版 本 (简单 任务 )。 然 后 ， 编 写 一 个 PathFinder 版 
本 ， 支 持 使 用 你 编写 的 可 比较 的 泛 型 顶点 类 型 来 查找 最 短路 径 (困难 任务 )。 
创建 上 一 个 练习 中 Graph 的 一 个 版 本 ， 以 支持 二 部 图 (图 中 所 有 的 边 都 是 从 一 类 可 比较 的 泛 型 
顶点 连接 到 另 一 类 可 比较 的 泛 型 顶点 )。 
判断 题 : 在 广度 优先 搜索 期 间 的 某 时 刻 ， 队 列 可 以 包含 两 个 顶点 ,一 个 与 源 距离 为 7， 一 个 距 
离 为 9。 
答案 : 错 。 该 队列 可 以 包含 至 多 两 个 不 同 距离 4 和 d+l 的 项 点。 广度 优先 搜索 以 距离 源 的 距 
离 递增 的 顺序 来 检查 顶点 。 当 检查 距离 为 4 的 顶点 时 ， 只 有 距离 d+1 的 顶点 可 以 入 队 。 
通过 归纳 法 证 明 PathFinder 可 以 计算 出 从 源 到 每 个 顶点 的 最 短路 径 (和 最 短路 径 距 离 )。 
假设 你 在 PathFinder 中 使 用 栈 而 非 队 列 进 行 广度 优先 搜索 。 它 是 否 仍然 可 以 计算 从 源 到 每 个 
顶点 的 路 径 ? 它 是 否 仍然 可 以 计算 最 短路 径 ? 分 别 证 明 或 给 出 一 个 反例 。 
在 pathTo0 中 生成 最 短路 径 时 ， 使 用 队列 而 不 是 栈 的 效果 是 什么 ? 
向 PathFinder 添加 isReachable(v) 方法， 如 果 从 source 到 v 存在 路 径 ， 返 回 true， 否 则 返回 
false。 
编写 一 个 Graph 客户 程序 ， 用 于 从 文件 中 读 取 图 (以 正文 中 指定 的 文件 格式 )， 然 后 打印 图 中 
的 边 ， 每 行 一 个 。 
实现 一 个 PathFinder 的 客户 程序 AllShortestPaths， 它 为 每 个 顶点 创建 一 个 PathFinder 对 象 ， 
以 及 一 个 测试 客户 程序 ， 它 从 标准 输 大 中 获得 一 对 顶点 信息 ， 用 于 查询 并 打印 连接 它们 的 最 
短路 径 。 支 持 分 隔 符 ， 以 便 你 可 以 在 一 行 中 输入 两 个 字符 串 以 查询 (用 分 隔 符 分 隔 )， 并 输出 
它们 之 间 的 最 短路 径 。 注 意 : 对 于 movies.txt， 查 询 字符 串 可 能 两 个 都 是 演员 ， 可 能 两 个 都 是 
电影 ， 也 可 以 是 一 个 演员 和 一 部 电影 。 
编写 一 个 程序 ， 在 一 个 包含 1000 个 顶点 的 三 阶 环 图 中 ， 增 加 若干 条 随机 捷径 ， 请 绘制 平均 路 
径 长 度 和 随机 捷径 边 的 数量 之 间 的 关系 图 。 
重 载 SmallWorld (程序 4.5.5 ) 中 的 函数 clusterCoefficient()， 增 加 一 个 整数 参数 k， 以 便 它 根 
据 当 前 存在 的 所 有 边 数 ， 以 及 顶点 之 间距 离 为 k 的 顶点 集合 中 可 能 的 总 边 数 ， 计 算 图 的 局 部 
聚集 系数 。 当 等 于 1 时， 函数 产生 的 结果 与 函数 的 无 参数 版 本 相同 。 
证 明 大 阶 环 图 中 的 聚集 系数 为 (2k-2)/(2k-1)。 推 导出 一 个 和 上 的 函数 ,计算 VV 个 顶点 上 的 
阶 环 图 中 的 平均 路 径 长 度 。 
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4.5.21 ”证明 人 V 个 顶点 的 二 阶 环 图 中 的 直径 是 ~V/4。 并 证 明 如 果 添 加 连接 两 个 对 角 顶 点 的 一 条 边 ， 则 
直径 将 减 小 到 ~V/8。 

4.5.22 ”进行 计算 实验 ， 以 验证 天 个 顶点 的 轮 环 图 中 的 平均 路 径 长 度 为 ~1/4 V。 将 一 个 随机 边 添加 到 
轮 环 图 中 ， 并 验证 平均 路 径 长 度 减少 到 ~3/16 V。 

4.5.23 “为 SmallWorld (程序 4.5.5 ) 添加 函数 isSmallWorld()， 该 函数 以 图 作为 参数 ， 如 果 图 符合 小 世 
界 现象 的 规则 (依据 正文 定义 的 具体 阔 值 )， 则 返回 true， 否 则 返回 false。 

4.5.24 “为 SmallWorld (程序 4.5.5 ) 实现 一 个 测试 客户 程序 main()， 它 产生 正文 中 给 定 的 输出 。 程 序 
应 该 将 图 文件 的 名 称 和 分 隔 符 作 为 命令 行 参 数 ; 打印 图 的 项 点 数量 、 平 均 度数 、 平 均 路 径 长 
度 和 聚集 系数 ; 并 指出 这 些 数 值 对 于 小 世界 现象 是 否 过 大 或 过 小 。 

4.5.25 ”编写 一 个 程序 ， 生 成 随机 连接 图 和 有 随机 捷径 的 二 阶 环 图 。 使 用 SmallWorld， 从 两 个 模型 (每 
个 具有 1000 个 顶点 ) 生成 500 个 随机 图 并 计算 它们 的 平均 度 、 平 均 路 径 长 度 和 聚集 系数 。 将 你 
的 结果 与 4.5 节 “ 具 有 1000 个 顶点 的 不 同 种 类 的 图 的 小 世界 参数 ”表格 中 的 相应 值 进 行 比较 。 

4.5.26” ”编写 一 个 SmallWorld 和 Graph 的 客户 程序 ， 生 成 k 阶 环 图 并 测试 它们 
是 否 符 合 小 世界 现象 (首先 做 练习 4.5.23 )。 

4.5.27 “在 一 个 网 格 图 (grid'graph) 中 ， 顶 点 排列 在 一 个 nXn 的 网 格 中 ， 每 个 
顶点 与 网 格 中 上 下 左右 的 邻接 顶点 用 边 相 连 。 撰 写 一 个 SmallWorld 和 
Graph 客户 程序 ， 来 生成 网 格 图 并 测试 它们 是 否 符合 小 世界 现象 的 规则 
(首先 做 练习 4.5.23 )。 

4.5.28 ”扩展 以 上 两 个 练习 的 解决 方案 ， 读 入 一 个 命令 行 参数 m， 并 将 m 个 随机 三 阶 环 图 
边 添加 到 图 中 。 用 你 的 程序 对 大 约 1000 个 顶点 的 图 进行 实验 ， 以 找到 
边 相 对 较 少 的 小 世界 图 。 

4.5.29 ”编写 一 个 Graph 和 PathFinder 的 客户 程序 ， 它 将 电影 -演员 列表 文件 的 
名 称 和 分 隔 符 作 为 参数 ， 并 写 人 一 个 新 的 电影 -演员 列表 文件 ， 但 删除 
了 未 连接 到 凯 文 ， 贝 肯 的 所 有 电影 。 et 

创新 练习 

4.5.30 ”大 贝 肯 数 。 找 到 movies.txt 中 拥有 最 大 (但 有 限 ) 凯 文 * 贝 肯 数 的 演员 (不 与 凯 文 * 贝 肯 连接 
的 演员 会 是 正 无 穷 一 一 译 者 注 )。 

4.5.31 ”直方 图 。 编写 一 个 BaconHistogram 程序 ， 打 印 凯 文 * 贝 肯 数 的 直方 图 ， 指 出 movies.txt 中 有 
多 少 个 演员 的 贝 肯 数 为 0、1、2、3…… 为 那些 拥有 无 限 大 凯 文 * 贝 肯 数 (不 与 凯 文 * 贝 肯 连接 ) 
的 人 添加 一 个 类 别 。 

4.5.32 “演员 -演员 图 。 正 如 正文 中 所 提 到 的 ， 另 一 种 计算 凯 文 * 贝 肯 数 的 方法 是 建立 一 个 图 ， 其 中 
每 个 演员 (而 不 是 每 个 电影 ) 都 有 一 个 顶点 ， 如 果 两 个 演员 一 起 出 现在 电影 中 ,那么 它们 是 
相 邻 的 (参见 程序 4.5.6 )。 通 过 在 演员 一 演员 图 上 运行 广度 优先 搜索 计算 凯 文 * 贝 肯 数 ， 与 
movies.txt 的 运行 时 间 进 行 比较 ,解释 为 什么 这 种 方法 慢 很 多 。 同 时 解释 一 下 要 怎么 在 路 径 中 
包含 电影 (我 们 的 实现 就 是 这 么 做 的 )。 

4.5.33 ”连通 分 量 。 图 中 的 连通 分 量 是 指 相互 连接 的 最 大 的 一 组 顶点 。 编 写 一 个 Graph 客户 程序 


CCFinder， 计 算 图 中 的 连通 组 件 ， 类 中 需要 一 个 将 Graph 作为 参数 的 构造 函数 ， 并 使 用 广度 
优先 搜索 计算 所 有 连通 分 量 。 还 需要 一 个 方法 areConnected(v,w)， 如 果 v 和 w 在 相同 的 连通 
分 量 中 则 返回 true， 否 则 返回 false。 还 要 添加 一 个 方法 components()， 它 返回 连通 分 量 的 数 
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量 (连通 分 量 未 必 只 有 一 个 ， 因 为 连通 分 量 强调 的 是 连接 尽 可 能 多 的 顶点 一 一 译 者 注 )。 
洪水 填充 / 图像 处 理 。Picture 是 一 个 Colour 值 的 二 维 数组 〈 见 3.1 节 )。 一 个 blob 是 相同 颜色 
的 相 邻 像素 的 集合 。 编 写 一 个 Graph 客户 程序 ， 其 构造 函数 从 给 定 的 图 像 创建 一 个 网 格 图 ( 见 
练习 4.5.27 )， 并 支持 洪水 填充 操作 。 给 定 像素 坐标 col 和 row 以 及 颜色 color， 将 该 像素 的 颜 
色 和 同一 个 blob 中 的 所 有 像素 的 颜色 更 改 为 color。 
词 梯 。 词 梯 是 指 若 两 个 单词 仅 有 一 个 字母 不 同 ， 则 两 个 单词 相连 ， 由 相连 单词 构成 的 单词 链 
称 为 词 梯 。 编 写 一 个 程序 WordLadder， 从 标准 输入 中 读 取 一 个 5 字母 的 单词 列表 ,将 两 个 5 
字母 字符 串 作 为 命令 行 参数 ， 为 这 两 个 参数 输出 最 短 词 梯 (车 存在 的 话 )。 作 为 一 个 例子 ， 下 
面 的 词 梯 连 接 了 green 和 brown: 
green greet great groat groan grown brown 

编写 一 个 过 滤器 ， 从 标准 输入 中 获取 系统 词典 的 5 字母 单词 ,或 者 从 本 书 网 站 下 载 列表 。 
(这 个 游戏 最 初 被 称 为 doublet， 是 由 Lewis Carroll 发 明 的 。) 
所 有 路 径 。 编 写 一 个 Graph 的 客户 程序 AllPaths， 其 构造 函数 将 Graph 作为 参数 ， 并 计算 和 
打印 出 图 中 两 个 给 定 顶 点 s 和 +t 之 间 所 有 的 简单 路 径 。 简 单 路 径 ( simple path) 是 指 不 存在 任 
何 重 复 项 点 的 路 径 。 在 二 维 网 格 中 ， 这 样 的 路 径 被 称 为 自 避 行走 (self-avoiding walks， 见 1.4 
节 )。 枚 举 路 径 是 统计 物理 学 和 理论 化 学 中 的 一 个 基本 问题 一 一 例如 ,模拟 线性 聚合 物 分 子 在 
溶液 中 的 空间 排列 。 注 意 : 路 径 的 数量 可 能 会 是 指数 级 的 。 
渗透 阅 值 。 为 渗透 开发 一 个 图 模型 ， 编 写 一 个 与 Percolation (程序 2.4.5 ) 执行 相同 计算 的 
Graph 客户 程序 。 估 算 三 角形 、 正 方形 和 六 角形 网 格 的 渗透 贱 值 。 
地 铁 图 。 在 东京 地 铁 系统 中 ， 路 线 由 字母 标记 ， 站 点 由 数字 标记 ， 如 G-8 或 A-3。 其 中 仅 有 
某 些 站 点 允许 换 乘 。 在 网 络 上 查找 东京 地 铁 地 图 ， 开 发 一 个 简单 的 文件 格式 ， 然 后 编写 一 个 
Graph 的 客户 程序 ， 它 读 人 文件 并 可 以 回答 东京 地 铁 系统 的 最 短路 径 查 询 的 问题 。 如 果 你 愿 
意 的 话 ， 做 一 个 巴黎 的 地 铁 系 统 ， 路 线 是 由 一 连 串 名 字 构 成 的 ， 当 两 个 站 点 有 同样 的 名 字 时 ， 
表示 可 以 换 乘 。 
好 菜 坞 宇宙 的 中 心 。 我 们 可 以 通过 计算 每 个 演员 的 好 菜 坞 数 〈(Hollywood number) 或 平均 路 径 
长 度 来 衡量 把 凯 文 ， 贝 肯 作 为 中 心 是 否 合适 。 凯 文 ， 贝 肯 的 好 莱 坞 数 是 所 有 演员 〈 在 其 连通 分 
量 中 ) 的 贝 肯 数 的 平均 值 。 其 他 演员 的 好 莱 坞 数 也 是 用 相同 的 方法 计算 出 来 的 ， 只 需要 将 这 个 
演员 取代 凯 文 * 贝 肯 作为 源 。 计 算 凯 文 * 贝 肯 的 好 莱 坞 数 ， 找 到 一 个 好 莱 坞 数 比 凯 文 * 贝 肯 
更 好 的 演员 。 在 与 凯 文 ， 贝 肯 位 于 同一 个 连通 分 量 中 ， 找 到 具有 最 好 和 最 差 好 莱 坞 数 的 演员 。 
直径 。 顶 点 的 偏心 率 〈eccentricity) 是 其 与 任何 其 他 顶点 之 间 的 最 大 距离 。 图 的 直径 是 任何 两 
个 顶点 之 间 的 最 大 距离 (任何 顶点 的 最 大 偏心 率 )。 写 一 个 Graph 的 客户 程序 Diameter， 可 以 
计算 顶点 的 偏心 率 和 图 的 直径 。 使 用 它 来 查找 与 movies.txt 关联 的 演员 -演员 图 的 直径 。 
有 向 图 。 实 现 一 个 Digraph 数据 类 型 来 表示 有 向 图 ， 其 中 边 的 方向 是 有 意义 的 : addEdge(v,w) 
表示 从 v 到 w 添加 边 ， 而 不 是 从 ww 到 v。 用 以 下 两 个 方法 替换 adjacentTo() : 一 个 返回 由 参数 
顶点 出 发 的 有 向 边 的 到 达 顶 点 列表 ， 另 一 个 返回 到 达 参 数 顶点 的 有 向 边 的 出 发 顶点 列表 。 解 
释 如 何 修改 PathFinder 以 找到 有 向 图 中 的 最 短路 径 。 
随机 游 走 。 修 改 前 一 个 练习 中 的 Digraph 类 ， 以 创建 允许 平行 边 的 MultiDigraph 类 。 对 于 测 
试 客户 程序 ， 运 行 与 RandomSurfer (程序 1.6.2 ) 匹配 的 随机 游 走 模拟 。 
传递 闭 包 。 编 写 一 个 Digraph 客户 程序 TransitiveClosure， 甚 构造 函数 将 Digraph 作为 参数 ， 
如 果 存 在 从 v 到 w 的 某 个 有 向 路 径 ， 其 方法 isReachable(v，w) 返回 true， 香 则 返回 false。 提 
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示 : 从 每 个 顶点 运行 广度 优先 搜索 。 

统计 抽样 。 使 用 统计 抽样 来 估计 图 的 平均 路 径 长 度 和 聚集 系数 。 例 如 ， 为 了 估计 聚集 系数 ， 

挑选 trials 份 随机 顶点 并 计算 这 些 顶 点 的 聚集 系数 的 平均 值 。 你 的 函数 的 运行 时 间 应 该 比 

SmallWorld 的 相应 函数 快 几 个 数量 级 。 

履 盖 时 间 。 一 个 无 向 连通 图 中 的 随机 游 走 (random walk) 是 指 从 一 个 顶点 移动 到 它 的 邻接 顶 

点 之 一 ， 在 这 里 每 个 可 能 性 都 有 相等 的 被 选择 概率 (这 个 过 程 是 对 无 向 图 的 随机 游 走 模拟 )。 

编写 程序 来 运行 实验 ， 以 验证 关于 访问 图 中 每 个 顶点 所 需 步 数 的 假设 。 具 有 TV 个 顶点 的 完全 

图 的 覆盖 时 间 是 多 少 ? 一 个 轮 环 图 呢 ? 你 能 找到 一 系列 图 ， 其 覆盖 时 间 与 到 或 27 成 正比 吗 ? 

Erd5s-Renyi 随机 图 模型 。 在 经 典 的 Erd5s-Renyi 随机 图 模型 中 ,我 们 在 天 个 顶点 上 建立 一 

随机 图 ， 包 含 每 个 可 能 的 边 的 概率 为 p， 是 否 包 含 一 个 边 与 其 他 边 无 关 。 构 建 一 个 Graph x 

程序 来 验证 以 下 属性 : 

e 连接 性 阅 值 ( Connectivity thresholds) : 如 果 p<1/V 并 且 V 很 大 ， 那么 大 多 数 连 通 分 量 都 很 
小 ， 最 大 为 对 数 大 小 。 如 果 p>1/V， 那 么 肯定 会 有 一 个 包含 几乎 所 有 顶点 的 巨大 连通 分 量 。 
如 果 p<(In V/V， 则 图 以 高 概率 断 开 ; 如 果 P>ln WV， 则 图 以 高 概率 连接 。 

e 度 的 分 布 ( Distribution of degrees): 度 的 分 布 遵循 以 平均 值 为 中 心 的 二 项 分 布 ， 所 以 大 多 
数 顶 点 具有 相似 的 度数 。 顶 点 与 其 他 个 顶点 相 邻 的 概率 以 的 指数 级 减 小 。 

。 没有 枢纽 (No hubs): 当 p 是 一 个 常数 时 ,顶点 的 最 大 度数 最 多 是 下 的 对 数 。 

e 没有 局 部 聚集 (No local clustering) : 如 果 图 是 稀 玖 日 连通 的 ， 则 聚集 系数 接近 于 0。 随 机 
图 不 是 小 世界 图 。 

e 短路 径 长 度 (Short path lengths): 如 果 p>ln V/V， 那 么 图 的 直径 ( 见 练习 4.5.40 ) 是 对 数 级 的 。 

网 络 链接 的 能 量 法 则 。 网 页 的 人 度 和 出 度 遵 循 用 首选 连接 过 程 建 模 的 能 量 法 则 。 假 设 每 个 网 

页 只 有 一 个 输出 链接 ， 所 有 网 页 都 是 依次 创建 的 ， 一 次 只 创建 一 个 页 面 ， 最 初 的 页 面 只 有 

一 个 指向 自己 的 链接 。 以 概率 p<1， 它 随机 均匀 选择 现 有 页 面 之 一 并 与 之 建立 链接 。 以 概率 

1-p， 它 链接 到 一 个 现 有 的 页 面 ， 其 概率 与 该 页 面 的 传人 链接 的 数量 成 正比 。 这 个 规则 反映 了 

新 网 页 指向 流行 网 页 的 普遍 趋势 。 撰 写 一 个 程序 来 模拟 这 个 过 程 ， 并 画 出 传 和 链接 数量 的 直 

方 图 。 

部 分 解答 。 人 度 为 下 的 网 页 数 与 请 2 成 正比 。 

全 局 聚集 系数 。 为 SmallWorld 添加 一 个 计算 图 的 全 局 聚集 系数 的 函数 。 全 局 聚集 系数 是 与 一 

个 公共 顶点 相 邻 的 两 个 随机 顶点 彼此 相 邻 的 条 件 概 率 。 找 出 局 部 聚集 系数 和 全 局 聚集 系数 不 

同 的 图 。 

Watts-Strogatz 图 模型 。( 见 练习 4.5.27 和 练习 4.5.28 ) Watts 和 Strogatz 提出 了 一 个 混合 模型 ， 

这 个 模型 中 的 顶点 与 相 邻 的 顶点 都 存在 链接 (人 们 往往 认识 地 理 位 置 比较 近 的 人 )， 还 有 一 些 

随机 的 远 链 接 。 对 n=100 阶 网 格 图 ,绘制 当 为 其 添加 随机 边 时 ， 平均 路 径 长 度 和 聚集 系数 的 

变化 效果 。 对 于 有 个 顶点 的 磊 阶 环 图 ， 同 样 绘制 添加 随机 边 的 效果 图 ， 其 中 天 10 000, 上 的 

上 限 为 10 log V。 

Bollobis-Chung 图 模型 。Bollobis 和 Chung 提出 了 一 种 混合 模型 ， 它 在 了 个 顶点 (下 是 偶数 ) 

上 加 上 一 个 二 阶 环 图 ， 再 加 上 一 个 随机 匹配 (random matching)。 匹 配 是 指 每 个 顶点 的 度数 均 

为 1 的 图 。 为 了 生成 随机 匹配 ， 将 和 个 顶点 随机 排序 ， 并 在 排 定 的 顺序 中 在 顶点 半 和 顶点 二 1 

之 间 添 加 边 。 确 定 此 模型 中 图 的 每 个 顶点 的 度数 。 使 用 SmallWorld， 估 计 根 据 这 个 模型 产生 

的 无 1 000 的 图 的 平均 路 径 长 度 和 局 部 聚集 系数 。 
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实体 计算 机 看 起 来 非常 复杂 ， 因 此 难以 对 它 进行 分 析 ， 但 是 最 终 我 们 建立 并 且 使 用 了 它 
们 ， 这 表明 我 们 实际 上 是 可 以 了 解 它们 的 本 质 特征 的 。 在 本 章 中 ,我 们 通过 对 一 台 计算 机 功 
能 和 限制 进行 严格 的 研究 ， 以 揭示 所 有 已 知 类 型 的 计算 机 的 共同 特征 。 通 过 对 这 些 分析 ， 让 
我 们 有 能 力 思考 下 面 这 些 基 本 问题 : 

。 某 些 计 算 机 本 质 上 就 比 其 他 计算 机 更 强大 吗 ? 

。 我们 能 用 计算 机 来 解决 什么 类 型 的 问题 ? 

。 计算 机 能 做 的 事情 有 极限 吗 ? 

。 在 有 限 的 资源 下 ， 计 算 机 能 做 的 事情 的 极限 是 什么 ? 

这 些 都 是 很 深刻 的 问题 ，20 世纪 的 大 半 部 分 时 间 数 学 家 们 都 在 努力 解决 这 些 问题 。 为 
了 回答 这 些 问题 ， 我 们 会 构建 简化 和 理想 化 的 抽象 计算 机 ， 同 时 这 些 抽 象 计算 机 还 保留 了 真 
正 的 现代 计算 机 的 基本 属性 。 你 可 能 会 惊讶 地 发 现 ， 使 用 这 些 抽 象 计算 机 来 进行 细致 的 推 
理 ， 这 些 问题 是 可 以 找到 答案 的 。 

如 果 “ 理 论 ”( theory) 这 个 词 让 你 感到 恐惧 ， 请 不 要 绝望 。 我 们 会 使 用 简单 易 懂 的 数学 
模型 。 我 们 会 研究 一 些 计算 方面 的 美妙 的 定理 并 且 让 你 相信 这 些 定理 的 真实 性 。 我 们 不 会 要 
求 你 学 习 如 何 证 明 数 学 定理 〈 这 种 能 力 就 像 编 程 ， 是 一 种 后 天 学 习 的 技能 )， 但 是 你 需要 花 
时 间 理 解 我 们 展示 给 你 的 逐步 推理 过 程 。 这 样 做 的 一 个 好 处 是 它 有 可 能 帮助 你 成 为 一 个 更 好 
的 程序 员 《〈 这 个 过 程 有 点 像 调试 )， 但 是 我 们 的 主要 目标 是 让 你 学 习 如 何 体会 一 些 关 于 计算 
的 核心 事实 。 

我 们 为 什么 要 深入 地 考虑 这 些 理论 问题 呢 ? 难道 不 应 该 把 这 些 问 题 留 给 计算 理论 方面 最 
好 的 专家 吗 ? 你 可 能 会 对 其 他 科学 学 科 问 同样 的 问题 ， 而 计算 机 科学 对 于 这 些 问题 的 答案 与 
物理 、 化 学 或 者 生物 学 相同 。 我 们 用 来 理解 计算 的 那些 模型 都 是 很 基础 的 模型 ， 我 们 从 这 些 
模型 中 得 出 来 的 结论 对 我 们 生活 的 世界 有 着 很 深远 的 影响 。 许 多 人 可 能 会 为 我 们 能 够 解决 这 
些 基 本 问题 感到 惊讶 和 兴奋 。 当 你 看 完 本 章 后 ， 你 可 能 会 发 现 自己 很 想 向 朋友 或 者 家 人 解释 
为 什么 计算 机 世界 是 现在 的 这 个 样子 。 

一 个 程序 员 为 什么 要 关心 计算 理论 ? 在 这 么 一 个 青少年 都 努力 地 将 自己 的 编程 技能 转化 
为 无 数 财富 的 世界 中 ， 人 们 很 快 就 会 有 计算 机 是 无 所 不 能 的 这 种 感觉 。 但 是 令 人 失望 的 是 ， 
计算 理论 告诉 我 们 事实 绝对 不 是 期 望 的 那样 。 一 个 人 如 果 没 有 理解 我 们 在 本 章 提出 的 理论 问 
题 ， 那 么 他 就 不 能 有 效 地 使 用 计算 机 。 这 个 理论 提供 了 一 个 框架 来 帮助 我 们 了 解 我 们 可 以 解 
决 什么 类 型 的 问题 。 除 此 之 外 ， 计 算 理 论 一 直 对 实践 应 用 有 所 启发 。 我 们 所 使 用 的 许多 工具 
(编程 语言 就 是 一 种 ) 都 是 这 种 理论 直接 产生 的 。 

一 个 科学 家 或 者 一 个 工程 师 为 什么 要 关心 理论 计算 呢 ? 因为 现在 每 一 个 科学 家 和 每 一 个 
工程 师 都 是 一 个 程序 员 ， 所 以 上 一 段 所 提 到 的 对 于 他 们 同样 适用 。 但 是 这 个 理论 让 人 感到 非 
常 抽象 ， 与 我 们 生活 的 世界 相去 甚 远 。 上 了 年 纪 的 科学 家 和 工程 师 们 倾向 于 仅仅 将 计算 机 当 
成 一 个 工具 ， 就 像 一 个 计算 器 一 样 。 但 是 事实 完全 相反 。 在 解决 了 将 近 一 个 世纪 以 来 与 计算 
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相关 的 间 题 之 后 ， 研 究 人 员 认 识 到 一 个 明确 的 转变 : 在 20 世纪 及 以 前 ， 科 学 是 建立 在 理解 
宇宙 的 数学 (mathematical) 模型 上 的 ; 在 21 世纪， 我 们 越 来 越 依赖 于 对 计算 (computational) 
模型 的 使 用 。 由 计算 理论 发 现 的 基本 思想 对 科学 进步 的 影响 在 当今 世界 是 无 可 争议 的 。 

一 个 人 类 学 家 为 什么 要 关心 计算 理论 呢 ? 除去 现在 很 多 人 类 学 家 也 是 程序 员 这 个 事实 
外 ， 这 个 问题 的 简单 答案 可 能 是 这 个 世界 上 有 很 多 事情 值得 学 习 和 理解 ， 本 章 (还 有 接 下 来 
的 两 章 ) 的 关于 计算 理论 的 故事 绝对 是 一 个 值得 投入 时 间 和 精力 的 话题 。 从 哲学 的 角度 上 
讲 ， 我 们 要 理解 人 类 与 计算 机 的 关系 ,而且 随 着 计算 机 在 我 们 的 生活 中 变 得 无 所 不 在 ， 追 求 
对 这 种 关系 的 理解 的 必要 性 显得 越 来 越 迫 切 。 而 对 计算 理论 的 理解 至 少 是 追求 对 这 种 关系 理 
解 的 一 个 起 点 。 正 如 你 看 到 的 ， 理 论 研 究 的 起 源 之 一 是 对 于 数学 的 基本 哲学 问题 的 追求 ; 而 
现在 则 是 对 于 计算 的 基本 哲学 问题 的 追求 。 

除了 这 些 普 遍 的 原因 之 外 ， 还 有 一 个 特别 的 理由 让 我 们 仔细 地 对 待 本 书 中 的 计算 理论 ， 
即 它 提 供 了 一 个 历史 视角 以 便于 我 们 理解 计算 机 如 何 工 作 的 发 展 历 程 。 同 许多 其 他 的 科学 一 
样 ， 历史 与 理论 以 巧妙 的 方式 相互 交织 ， 并 能 够 相互 促进 对 对 方 的 理解 。 虽 然 这 不 是 一 本 历 
史书 ， 我 们 也 无 法 全 面 且 详 细 地 讲述 历史 细节 ， 但 每 个 对 计算 机 感 兴趣 的 人 都 会 因为 了 解 这 
段 历史 的 亮点 而 受益 。 

本 章 的 中 心 人 物 是 艾 伦 : 图 灵 。 这 位 英国 数学 家 在 20 世纪 
30 年 代 这 段 时 间 在 剑桥 大 学 和 普林斯顿 大 学 工作 。 在 战争 期 间 的 
布 菜 切 利 园 (Bletchley Park)， 许 多 人 认为 他 通过 破译 德国 的 英 格 
玛 密 码 为 加 快 第 二 次 世界 大 战 结束 的 进程 发 挥 了 核心 作用 。 在 战 
后 ， 图 灵 在 计算 机 科学 领域 做 出 了 许多 有 创造 力 的 贡献 ， 其 中 就 包 
括 了 对 人 工 智 能 概念 的 初步 思考 。 在 50 年 代 初 期 ， 这 项 工作 因 他 
被 起 诉 为 同性 恋 者 而 停止 。 随 后 ， 图 灵 因 为 吃 了 一 个 含有 和 氰 化 物 
的 苹果 而 死亡 (关于 他 死亡 的 确切 情况 是 未 知 且 有 和 争议 的 )。 直 到 艾 伦 图 灵 (1912 1944 ) 
2013 年 ， 英 国 女王 签署 了 一 个 死 后 赦免 的 法 案 才 推翻 了 图 灵 的 定罪 。 在 当代 ， 图 灵 被 认为 是 
“计算 机 科学 之 父 ”。 你 可 以 通过 阅读 “问答 环节 ”的 参考 文献 来 了 解 更 多 图 灵 的 个 人 事迹 。 

本 章 我 们 将 重点 介绍 图 灵 在 1937 年 的 伦敦 数学 学 会 会 议 上 发 表 的 一 篇 名 为 “可 计算 数 
及 其 在 决策 问题 上 的 应 用 ”的 文章 所 做 出 的 重大 贡献 。 这 篇 论文 被 誉 为 20 世纪 最 重要 的 科 
学 论文 之 一 ， 本 书 中 5.2、5.3 和 5.4 节 都 利用 了 这 篇 论文 的 结论 。 

为 了 了 解 图 灵 的 工作 ， 我们 需要 转变 自己 的 观点 。 我 们 从 一 个 数学 家 的 观点 出 发 ， 即 我 
们 试图 将 无 关 的 细节 排除 出 去 ， 而 只 专注 于 了 解 在 一 般 环 境 中 应 用 的 核心 问题 。5.1 节 致 力 
于 为 理解 图 灵 的 论文 莫 定 基础 。 

在 5.5 节 中 ， 我 们 介绍 在 计算 理论 领域 中 现代 研究 的 焦点 ， 这 些 焦点 集中 在 图 灵 逝 世 之 
后 提出 而 且 至 今 未 解决 的 一 个 基本 问题 上 。 


5.1 ”形式 语言 
为 了 给 接 下 来 介绍 的 重要 理论 问题 莫 定 基础 ， 开 始 之 前 ， 我 们 先 定义 一 些 非 常 简单 的 抽 
象 概念 。 接 下 来 ,我 们 要 介绍 一 个 广泛 使 用 的 软件 工具 及 其 相关 机 制 ， 并 附 上 一 些 应 用 程序 。 
基本 定义 “我们 从 符号 ( symbol) 这 个 抽象 概念 开始 ， 这 个 概念 是 我 们 构建 后 继 内 容 的 
基础 。 在 数学 上 ,符号 可 以 是 能 够 相互 区 分 的 任 一 标识 。 在 刚 开始 时 ， 把 符号 当成 一 个 字符 
或 者 数字 元 素 是 非常 有 帮助 的 。 下 面 我 们 阐明 基本 定义 。 





Ey se et he eet da 


定义 : 一 个 字符 囊 表示 有 限 符号 集 的 一 个 序列 。 六 
定义 ， 一 种 形式 语言 是 字符 囊 的 一 个 集合 (可 能 是 天 限 大 的 ) 这 村 伯 站 同一 
个 符号 集合 的 元 素 构成 。 


你 可 能 会 觉得 这 些 定义 中 的 前 两 个 对 你 来 说 非常 简单 和 熟悉 ， 因 此 没有 必要 给 出 它们 的 
定义 。 但 是 它们 定义 的 这 些 概念 是 非常 基本 的 ， 有 一 个 清晰 且 明 确 的 定义 十 分 重要 。 第 三 个 
定义 对 于 你 来 说 可 能 是 全 新 的 ， 所 以 你 应 该 着 重 理解 它 。 这 是 一 个 简单 的 定义 ， 而 且 从 现在 
开始 我 们 可 以 将 术语 “字符 串 的 集合 ”和 “形式 语言 ” 互 换 使 用 。 

例如 ， 十 进 制 数字 集 就 是 一 个 你 十 分 熟悉 的 符号 集 : {0, 1, 2, 3; 4, 5, 6, 7, 8, 9}。 像 
2147483648 这 样 一 个 整数 是 由 上 面 符号 集 组 成 的 一 个 字符 串 ， 所 以 我 们 可 以 将 形式 语言 正 
整数 (positive integer) 定义 成 由 这 个 符号 集 构成 的 不 以 0 为 开头 的 字符 串 的 集合 。 

二 进 制 字符 囊 。 接 下 来 我 们 分 析 一 个 三 进 制 字符 串 的 集合 (由 三 进 制 符号 集 组 成 的 形式 
语言 )， 它 仅仅 涉及 两 个 符号 。 具 体 这 两 个 符号 是 什么 并 不 重要 ， 我 们 可 以 使 用 {0, 1}, 但 是 
在 本 章 中 我 们 使 用 {a, b} 来 避免 与 整数 的 0 和 1 产生 混淆 。 确 定 一 种 形式 语言 的 最 简单 的 方 
式 就 是 枚 举 它 的 字符 串 。 这 是 一 种 可 以 精确 确定 形式 语言 的 方法 ,但 我 们 通常 还 会 用 非 形式 
的 描述 来 描述 语言 。 例 如 ， 我 们 可 以 用 “长 度 为 3 的 二 进 制 字符 串 ” 这 样 的 非 形式 描述 来 标 
识 形式 语言 (字符 串 的 集合 ); {aaa, aab, aba, abb, baa,; bab, bba, bbb}。 





在 语言 中 不 在 语言 中 
aa a 
倒数 第 二 个 符号 为 a bbbab aaaba 
bbbbbbbbbababab bbbbbbbbbbbbbb 
ba a 
a 与 b 的 数目 相等 bbaaba bbbaa 
aaaabbbbbbbaaaba abababababababa 
a ab 
回 文 aba bbbba 
abaabaabaaba abababababababab 
abba abb 
字母 申 中 含有 abba abaababbabbababbba bbabaab 
bbbbbbbbbbabbabbbbb aaaaaaaaaaaaaaaaa 
we bbb bb 
b 的 数量 可 以 被 3 整除 baaaaabaaaab abababab 
bbbabbaaabaaabababaaa aaaaaaaaaaaaaaaab 


由 二 进 制 符号 集 组 成 的 形式 语言 的 例子 


我 们 面临 的 第 一 个 复杂 因素 是 因为 语言 可 以 是 一 个 很 大 甚至 是 无 限 大 的 集合 ， 所 
以 我 们 无 法 总 是 用 列 出 语言 中 的 每 一 个 字符 串 的 方式 来 描述 它 。 例 如 ， 当 我 们 提 到 回 文 
(palindromes) 语言 《 回 文 是 指 从 头 读 到 尾 和 从 尾 读 到 头 是 一 模 一 样 的 二 进 制 字符 串 )， 或 者 
一 个 字符 串 中 a 与 b 的 数量 相等 的 语言 时 ， 你 可 以 很 清楚 地 知道 你 指 的 是 什么 ， 尽 管 这 两 种 
语言 的 集合 大 小 是 无 限 的， 我 们 无 法 列 出 它们 所 有 的 成 员 。 认 真 思 考 一 下 你 就 会 意识 到 ， 你 
之 所 以 非常 确定 这 些 语言 所 表达 的 意思 ， 是 因为 你 自己 能 轻易 地 判断 一 个 给 定 的 二 进 制 字符 
串 是 否 属于 这 些 语 言 。 我 们 选取 了 一 些 有 代表 性 并 能 表示 出 语言 特征 的 字符 串 ， 通 过 判别 这 
些 字 符 串 是 否 在 语言 中 来 让 你 更 好 地 理解 。 例 如 ， 我 们 将 一 种 语言 命名 为 b 的 数量 可 以 被 
3 整除 ， 你 可 能 会 产生 a 这 个 符号 是 否 可 以 包含 在 字符 串 中 这 种 疑问 。 但 是 当 我 们 举例 说 明 
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bbb 和 baaaaabaaaab 属于 这 种 语言 而 bb 和 abababab 不 属于 时 ， 你 会 对 我 们 的 意思 有 一 个 更 
好 的 理解 (a 这 个 符号 是 可 以 忽略 的 )。 这 些 例子 以 及 其 他 的 一 些 例子 都 展示 在 上 表 中 。 

其 他 符号 集 。 通 过 对 二 进 制 字 符 串 的 适当 解释 ， 我 们 可 以 很 轻松 地 定义 与 计算 问题 相关 
的 形式 语言 。 如 你 所 知 ， 我 们 采用 二 进 制 来 编码 计算 机 程序 ， 而 现在 我 们 也 可 以 对 形式 语言 
进行 同样 的 操作 。 例 如 ， 我 们 可 以 定义 一 种 名 为 素数 的 语言 ， 它 是 所 有 用 二 进 制 来 表示 的 素 
数 的 字符 串 集合 。 但 是 采用 十 进 制 的 表示 法 来 定义 这 种 语言 更 为 自然 。 我 们 没有 理由 限制 自 
己 只 用 二 进 制 ， 我 们 可 以 使 用 手头 上 任何 适合 用 来 组 成 形式 语言 的 符号 集 : 像 用 于 处 理 文本 
的 标准 罗马 字母 ， 处 理 数 字 的 十 进 制 数字 ， 用 于 处 理 遗 传 数据 的 符号 集 {A, T C, G} 等 。 当 
语言 的 上 下 文 可 以 使 隐 星 的 符号 集 能 够 被 清晰 地 理解 时 ， 我 们 就 不 用 特意 指明 它 。“ 常 用 符 
号 集 及 相关 术语 ” 表 给 出 了 一 些 常用 的 符号 集 例子 。 

其 他 例子 。 在 “更 多 由 不 同 符号 集 组 成 的 形式 语言 的 例子 ” 表 申 我 们 给 出 了 一 些 基 于 
不 同 符号 集 的 形式 语言 的 例子 (其 中 几 个 会 在 本 节 的 后 面 详细 描述 ) 。 这 些 例子 清楚 地 表明 
了 形式 语言 这 个 概念 的 广泛 适用 性 。 这 些 形 式 语言 中 有 一 些 是 基于 数学 的 。 例 如 ， 一 个 由 十 
进 制 表示 的 字符 串 集 合 ， 这 个 集合 满足 对 于 一 个 整数 z， 存 在 正 整数 x、y， 当 n> 2 时 ,使 
得 x*” + 六 = z"。 这 种 语言 现在 被 认为 是 一 个 空 集 ,， 但 是 你 可 能 会 难以 说 服 自己 这 是 对 的 。 这 
是 著名 的 费 马 大 定理 的 一 种 表现 形式 ， 是 一 个 300 多 年 来 都 未 能 得 到 证 实 的 猜想 ， 直 到 安 德 
鲁 … 威 尔 斯 (Andrew Wiles) 在 20 世纪 90 年 代 提 出 了 一 个 证 明 方 法 。 其 他 形式 语言 也 有 基 
于 人 类 语言 的 、Java 的 或 者 基因 组 学 的 。 我 们 可 以 定义 一 种 叫 作 莎士比亚 的 语言 用 于 表示 莎 
士 比 亚 的 所 有 戏剧 ， 或 者 定义 一 种 叫 泰 勒 的 语言 用 于 表示 泰勒 的 所 有 作品 。 








符号 符号 名 字符 申 名 
二 进 制 01 (或 者 ab ) 位 位 字符 串 
器 abcdefghijklmnopqrstuvwxyz > 
罗马 字母 ABCDEFGHIJKLMNOPQRSTUVWXYZ 子 革 单词 
十 进 制 数 0123456789 数字 整数 
特殊 符号 ~ !@#$%A8&*()_-+={[}]|IN\:;”'<,>.?/ 
键盘 输入 罗马 字母 + 十 进 制 数 + 特殊 符号 按键 打印 稿 
基因 编码 ATCG 核 苷 酸 碱 基 DNA 
蛋白 质 纲 码 ACDEFGHIKLMNPQRSTVWY 氨基 酸 蛋白 质 
ASCII 见 6.1 节 字 节 字符 串 
Unicode 见 6.1 节 字符 字符 串 
常用 符号 集 及 相关 术语 
在 语言 中 不 在 语言 中 
madamimadam madamimbob 
回 文 amanaplanacanalpanama madam, i'm adam 
amoraroma not a palindrome 
3 2 
奇数 101 100 
583805233 2147483648 
3 0003 
素数 101 100 
583805233 2147483648 


更 多 由 不 同 符 号 集 组 成 的 形式 语言 的 例子 


对 于 整数 z， 能 找到 整数 x、 
y 满 足 室 + 六 = 过 


入 
13 


9833 9999 
对 于 整数 >， 能 找到 整数 x、 
eS 没有 整数 可 满足 所 有 整数 
AAA ACA ATA AGA CAA CCA ECG 
氨基 酸 编码 CTA CGA TCA TTA GAA GCA GTA 
GGA AAC ACC ABCDE 


美国 电话 号 码 


(609) 258-3000 


€99). 12-12-12 


(800) 555-1212 2147483648 
and abc 
英语 单词 middle niether 
computability misunderestimate 
~ i 二 This is a sentence . ER 
语法 正确 的 英文 句子 thi a. a bic.e?? 
Cogito ergo sum. 
a 12 
合法 的 Java 标 识 符 class 123a 
$xyz3_XYZ a((BC))* 
public class Hi { 
合法 的 Java 代 码 public static void OE Wanye to 


{ return 0; } 


main(String[] args) { } } 
更 多 由 不 同 符号 集 组 成 的 形式 语言 的 例子 ( 续 ) 


规范 问题 。 我 们 可 以 用 非 形 式 化 的 语言 描述 来 处 理 某 些 情况 (如 回 文 和 素数 )， 但 还 是 
有 一 些 不 足以 处 理 的 情况 (如 英语 句子 和 Java 程序 )。 为 什么 不 使 用 精确 、 完 整 的 定义 呢 ? 
这 是 问题 的 关键 所 在 ! 我 们 的 目标 是 使 用 精确 且 完 整 的 形式 语言 。 这 个 目标 被 称 为 形式 语言 
的 规范 问题 。 

那么 我 们 如 何 精确 且 完 整地 定义 一 种 形式 语言 呢 ? 我 们 的 非 形式 描述 能 够 解决 一 些 问 
题 ， 但 是 要 知道 ， 总 有 一 些 是 不 能 通过 语言 精确 描述 的 。 我 们 可 以 清楚 地 表达 一 些 形式 语 
言 ， 但 这 不 是 人 全部。 例如， 我们 能 和 否 规定 素数 前 面 可 以 有 前 导 零 ， 就 比如 字符 串 000017 是 
否 可 以 作为 素数 这 种 形式 语言 的 一 个 元 素 ? 请 注意 ， 这 个 决定 有 可 能 会 导致 每 个 素数 都 对 应 
无 数 个 字符 串 。 这 样 的 细节 使 得 定义 一 种 形式 语言 成 为 一 件 具 有 挑战 性 的 事情 。 但 是 这 个 挑 
战 的 关键 并 不 在 于 这 些 细节 ， 而 是 规范 问题 。 事 实证 明 ， 我 们 可 以 找 出 某 些 特定 类 别 的 形式 
语言 ， 它 们 非常 易于 给 出 严格 的 规范 。 稍 后 我 们 会 针对 其 中 一 种 基础 的 类 别 一 一 通常 简称 为 
正则 语言 (regular language)， 解 决 其 规范 问题 。 

识别 问题 。 一 旦 我 们 有 一 种 方法 指定 形式 语言 的 规范 ， 我 们 就 会 遇 到 下 面 这 种 问题 : 
给 定 一 种 语言 工 和 一 个 字符 串 x， 回 答 x* 是 否 在 工 里 面 ? 这 种 情况 被 称 为 形式 语言 的 识别 
问题 。 要 解决 识别 问题 ， 你 需要 拥有 一 台 计 算 机 (除了 计算 机 还 有 谁 可 以 告诉 你 一 个 十 亿 
位 级 的 字符 串 是 否 属于 回 文 或 者 是 否 拥有 相等 数量 的 a 和 b? )。 除 此 之 外 ， 你 需要 有 一 定 
的 数学 知识 ， 一 定 的 自然 语言 语法 知识 ， 以 及 数 不 清 的 其 他 领域 的 知识 。 幸 运 的 是 ,我 们 
同样 可 以 找 出 某 些 特定 类 别 的 形式 语言 ， 可 以 很 容易 地 解决 其 识别 问题 ， 同 时 又 非常 有 用 。 

我 们 将 通过 学 习 一 类 重要 的 语言 (正则 语言 ) 来 开始 我 们 对 形式 语言 的 学 习 。 我们 可 以 
为 正则 语言 找到 规范 和 识别 的 简单 的 解决 方案 。 然 后 我 们 可 以 看 到 这 些 解 决 方案 是 非常 重 
要 的 工具 ， 这 些 工具 被 广泛 用 于 各 种 实际 应 用 中 ， 这 其 中 涉及 自然 语言 (比如 英语 )、 编 程 
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语言 (比如 Java)、 基 因 编 码 以 及 许多 领域 。 在 这 之 后 的 5.2 节 ,， 我 们 会 回 到 对 基本 理论 
问题 的 学 习 。 值 得 注意 的 是 ， 我 们 用 于 解决 正则 语言 的 规范 问题 和 识别 问题 的 解决 方法 ， 
经 过 一 些 相对 简单 的 扩展 后 ,不仅 可 以 大 大 扩展 我 们 可 以 处 理 的 形式 语言 ， 而 且 将 我 们 
直接 引导 到 了 计算 问题 基本 原理 的 核心 部 分 。 事 实 上 ， 形 式 语言 与 计算 之 间 有 着 密切 的 
联系 。 

我 们 将 要 介绍 一 些 用 于 描述 形式 化 语言 的 机 制 ， 这 些 机 制 是 简单 、 紧 凑 且 优雅 的 。 它 们 
遵循 下 面 这 两 种 方法 之 一 。 第 一 种 方法 是 基于 语言 的 : 在 我 们 将 要 描述 的 语言 本 身 的 字符 之 
外 ,我 们 再 分 配 一 些 字符 用 来 描述 语言 的 规范 。 第 二 种 方法 是 基于 机 器 的 : 我 们 描述 了 一 类 
抽象 机 器 ， 每 一 个 机 器 都 对 应 于 一 种 语言 的 规范 和 识别 问题 。 

正则 语言 “为 了 方便 理解 形式 语言 ， 我 们 将 研究 一 类 被 称 为 正则 语言 的 简单 形式 语言 。 
为 了 解决 正则 语言 的 规范 和 识别 问题 ， 我 们 开发 了 一 种 基于 语言 的 方法 和 两 种 不 同 的 基于 机 
器 的 方法 。 然 后 ， 在 本 节 的 最 后 ， 我 们 会 讨论 这 三 者 的 关系 。 

基本 操作 。 由 于 形式 语言 是 一 个 字符 串 的 集合 ， 因 此 我 们 可 以 使 用 对 集合 的 基本 操作 来 
有 效 描述 形式 语言 的 规范 。 特 别 是 我 们 使 用 了 并 集 、 连 接 和 闭 包 这 些 运算 符 ， 我 们 首先 对 这 
些 操作 进行 简单 介绍 。 

当 且 仅 当 一 个 字符 串 属于 两 个 字符 串 集合 的 一 个 或 者 两 个 ,这 个 字符 串 就 属于 它们 的 并 
集 。 我 们 使 用 符号 R1S 来 表示 两 种 形式 语言 R 和 S 的 并 集 。 例 如 : 


fa, ba } |{ ab, bagb DDEab aba bis 


我 们 可 以 以 任何 顺序 列 出 一 个 语言 的 字符 串 成 员 ， 它们 都 表示 同一 个 集合 ， 但 是 在 集合 
中 不 会 包含 重复 的 字符 串 成 员 。 

两 个 字符 串 的 连接 是 将 第 三 个 字符 串 附加 到 第 一 个 字符 串 上 生成 的 字符 串 。 例 如 abb 和 
aab 的 连接 就 是 abbaab。 更 一 般 的 ， 由 连接 两 种 形式 语言 R 和 S 的 RS 是 将 R 中 的 任意 一 个 
字符 串 与 $ 中 的 任意 一 个 字符 串 连 接 所 生成 的 字符 串 的 集合 。 例如 : 


{a,ab} {a, ba bab } = { aa, aba, abab, abba, abbab } 


同样 的 ， 生 成 的 结果 集合 中 不 包含 重复 的 成 员 (在 上 面 例子 中 ，a 连接 ba 和 ab 连接 a 
都 可 以 生成 aba)。 

闭 包 指 从 一 种 语言 中 选取 0 个 或 多 个 字符 串 ， 用 这 些 字符 做 连接 操作 所 得 到 的 所 有 字符 串 
组 成 的 集合 。 如 果 R 是 一 个 非 空 集合 ， 那 么 符号 R* 就 可 以 表示 如 下 的 一 组 无 限 多 个 的 字符 串 : 

R* =€|R|RR|RRR | RRRR | RRRRR | RRRRRR - 


注意 ， 每 当 我 们 从 R 中 提取 一 个 字符 串 时 ,我 们 可 以 使 用 RR 中 的 任意 一 个 字符 串 。 例 
如 ，(alb)* 指定 了 所 有 二 进 制 字 符 串 的 集合 。 这 里 ，€ 指 的 是 空 字符 囊 一 一 由 0 个 字符 组 成 
的 字符 串 。 

如 果 我 们 有 一 个 含有 多 个 运算 符 的 正则 表达 式 ， 那 我 们 的 运算 符 应 该 按 一 种 什么 样 的 顺 
序 运 算 呢 ?与 算术 表达 式 一 样 ， 我 们 通过 括号 或 运算 符 的 优先 级 顺序 “yt 和 0 关 尖 太 
来 解决 这 种 模糊 问题 。 对 于 正则 表达 式 ， 闭 包 的 优先 级 比 连接 高 ， 连 
接 的 优先 级 比 并 集 高 。 例 如 ， 正 则 表达 式 blab 指定 的 集合 是 {b, ab} 而 “人 人” 
不 是 集合 {bb, ab}。 类 似 的 ， 正 则 表达 式 alb* 指定 的 是 与 al(b*) 相同 的 并 集 ” 闭 包 
集合 ,而 与 (alb)* 不 是 同一 个 语言 。 正则 表达 式 的 分 解 
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正则 表达 式 。 正 则 表达 式 是 一 个 由 符号 组 成 的 字符 串 ， 它 可 以 用 来 规范 一 种 形式 语言 。 
我 们 使 用 并 集 、 连 接 还 有 闭 包 这 些 用 在 集合 上 的 运算 符 ， 以 及 用 于 表达 操作 优先 级 的 括号 来 
递归 地 定义 什么 是 正则 表达 式 (以 及 它们 的 含义 )。 具 体 来 说 ， 每 一 个 正则 表达 式 要 么 是 符 
号 表 中 的 某 一 个 符号 (用 于 表示 包含 这 个 符号 的 单元 素 集 合 )， 要 么 就 是 由 下 列 运 算 符 得 到 
的 组 合 (R 和 S 都 是 正则 表达 式 ): 

。 并 集 : 规定 RIS 为 集合 R 和 集合 S 的 并 集 。 

。 连接 : 规定 RS 为 集合 R 和 集合 S 的 连接 。 

。 闭 包 : 规定 R* 为 集合 R 的 闭 包 。 

。 括号 : 规定 (R) 与 集合 R 相 同 。 

这 些 定义 都 包含 了 一 个 隐 式 的 假设 ， 即 假定 语言 的 符号 集 之 中 是 不 包含 符号 “|” 
“(” 和 “)” 的 。 我 们 将 这 些 符号 称 为 元 符号 〈metasymbol)， 并 在 稍 后 讨论 如 何 处 理 包含 这 
些 符号 的 语言 。 

正则 语言 。 以 上 递归 定义 不 仅 可 以 用 于 建立 任意 复杂 度 的 正则 表达 式 ， 还 可 以 准确 地 定 
义 这 些 正 则 表达 式 的 含义 。 每 个 正则 表达 式 都 能 够 完整 地 描述 一 些 形式 语言 ， 但 不 是 每 一 种 
形式 语言 都 可 以 被 正则 表达 式 规范 地 描述 。 稍 后 ， 我 们 会 正式 地 证 明 这 个 事实 。 这 种 证 明 的 
过 程 是 通过 找到 一 种 不 能 被 任何 正则 表达 式 所 规范 的 形式 语言 来 实现 的 。 但 是 可 以 用 一 些 正 
则 表达 式 来 规范 的 这 类 形式 语言 是 非常 重要 的 ， 对 它 有 如 下 定义 : 

定义 ， 当 目 仅 当 一 种 语言 能 被 -条 正则 表达 式 描述 时 ， 它 是 正则 的 。 

下 面 表格 中 给 出 了 一 些 正 则 语言 的 例子 ， 并 且 还 附 有 描述 这 些 正则 语言 的 正则 表达 式 ， 
以 及 属于 这 些 正 则 语言 的 字符 串 实例 和 不 属于 这 些 正则 语言 的 字符 串 实例 。 那 么 我 们 如 何 确 
保 每 一 个 正则 表达 式 规 范 的 正则 语言 与 非 正 式 描 述 的 相同 呢 ? 一 般 来 说 ， 对 每 一 个 正则 表达 
式 我 们 都 需要 进行 相应 的 证 明 ， 而 且 做 这 样 的 证 明 往 往 有 一 定 的 难度 。 正 则 表达 式 的 重要 意 
义 就 在 于 它们 可 以 让 我 们 摆脱 非 形式 的 描述 ， 因 为 它们 提供 了 一 种 用 来 规范 语言 的 方式 ， 这 
种 方式 对 于 那些 重要 的 应 用 来 说 十 分 自然 并 且 严 谨 。 无 论 我 们 对 非 形 式 规范 的 准确 性 是 否 有 
信心 ， 每 个 正则 表达 式 都 是 对 一 些 正则 语言 精确 且 完 整 的 描述 。 事 实 上 ,我们 可 以 写 下 一 个 
形式 正确 的 正则 表达 式 却 不 需要 去 想 它 究 竞 描 述 了 哪 一 种 语言 ， 如 (ab*|aba)*(ab*alb(alb))*。 

为 了 熟悉 正则 表达 式 ， 你 应 该 花 时 间 让 你 自己 相信 表 中 的 每 个 正则 表达 式 确实 正确 描述 
了 它 所 声明 的 语言 。 首 先 你 不 仅仅 需要 确定 通过 验证 的 字符 串 符合 非 形式 描述 并 且 被 正则 表 
达 式 所 描述 ， 还 要 确定 不 属于 这 种 语言 的 那些 字符 串 不 符合 非 形式 描述 并 且 没 有 被 正则 表达 
式 所 描述 。 你 的 目标 是 理解 正则 表达 式 不 仅 规范 了 语言 中 的 所 有 字符 串 ， 并 且 仅 有 这 些 字符 
串 能 被 这 条 正则 表达 式 描述 。 下 面 的 段落 给 出 了 关于 某 些 语言 的 细节 。 


正则 语言 正则 表达 式 在 语言 中 不 在 语言 中 
二 进 制 符号 集 
aaaaa 


a 
倒数 第 五 个 符号 是 a (Calb)*a(al|b) (alb) (alb) (alb) bbbabbbb bbbbbbbba 
bbbbbbababababa aaaaaaaaaaabaaaa 


abba abb 


包含 字符 串 abba (alb)*abba(alb)* aababbabbababbba bbabaab 
bbbbbbbbabbabbbbb aaaaaaaaaaaaaaaa 


基于 不 同 符号 集 的 正则 表达 式 的 例子 
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aa bbb 
不 包含 字符 串 bbb (bbalbala*)*(a*|b|bb) ababababbaba ababbbbabab 
aaaaaaaaaaaaab bbbbbbbbbbbbb 
六 时 bbb b 
i 5 a*| (a*ba*ba*ba*)* aaa baaaaaaab 
征 3 的 佑 bbbaababbaa baabbbaaaaab 
十 进 制 数字 
» 中 5 
能 被 5 整除 的 正 整 数 5| (1|21..19) (0|1|:….19)*(015) 200 0005 
9836786785 3452345234 
11 011 
正三 元 数 (112) (0|1|2)* 19 
ES 9836786785 
小 写字 母 
2 raspberr subspace 
包含 字母 串 spb (Calblcl-1z) “spb(alb1cl-1z) cri 6 Es 
只 用 键 玲 的 typewriter alfalfa 
最 上 面 - 生 (qlwlelr|ltlylulilolp)* reporter paratrooper 
基因 编码 
脆性 XxX 染色 体 GCGCTG GCGCGG 
综合 征 图 谱 GCG(CGG|AGG)*CTG GCGCGGCTG CGGCGGCGGCTG 
A GCGCGGAGGCTG GCGCAGGCTG 


基于 不 同 符号 集 的 正则 表达 式 的 例子 ( 续 ) 


当 你 玩 填词 游戏 或 者 玩 单词 游戏 的 时 候 ， 你 可 能 会 遇 到 下 面 这 样 的 问题 :“ 一 个 8 个 字 
母 的 单词 ， 它 的 中 间 两 个 字母 是 hh， 这 个 单词 是 什么 ?” 一 旦 你 了 解 本 节 中 使 用 正则 表达 式 
的 描述 规则 ， 你 将 从 一 个 完全 不 同 的 角度 去 解决 填词 游戏 和 单词 游戏 的 问题 。 

在 基因 组 学 中 ， 基 于 符号 集 {A,，T,，C，G} 组 成 的 正则 表达 式 用 来 描述 基因 的 性 质 。 
例如 ， 人 类 基因 组 中 有 一 个 可 以 用 正则 表达 式 GCG(CGGIAGG)*CTG 来 描述 的 区 域 ， 这 个 
区 域 中 CGG/AGG 模式 在 不 同 的 个 体 之 间 高 度 不 一 致 。 已 知 有 一 种 会 引起 智力 低下 及 其 他 症 
状 的 遗传 性 疾病 与 CGG/AGG 基因 的 大 量 重复 有 关 。 正 则 表达 式 在 实践 中 被 广泛 地 用 于 解决 
这 类 重大 的 科学 问题 。 

在 信息 处 理 中 ,我 们 始终 关注 于 以 一 种 精确 且 完 整 的 方式 描述 信息 。 例 如 ， 当 你 将 
名 称 、 地 址 和 其 他 信息 输入 网 上 的 表格 时 , :处 理 信 息 的 程序 的 第 一 个 操作 是 检查 你 输入 的 
内 容 是 否 有 意义 。 如 果 你 在 一 个 期 望 你 输入 数字 的 地 方 输入 字母 ， 或 者 在 一 个 期 望 你 输入 
电话 号 码 的 地 方 输入 符号 $， 处 理 信 息 的 程序 都 会 标记 为 错误 并 要 求 你 改正 它们 。 我 们 很 
快 就 会 看 到 如 何 使 用 正则 表达 式 来 描述 熟悉 的 低层 次 的 抽象 概念 ， 如 日 期 、 信 用 卡号 以 及 
Java 标识 符 。 这 样 的 描述 可 以 方便 我 们 从 数据 库 中 将 相关 的 数据 提取 出 来 (如 科学 实验 的 
结果 )。 

在 计算 机 科学 中 ， 正 则 表达 式 无 处 不 在 。 正 如 你 所 看 到 的 ， 它 们 是 很 多 应 用 程序 都 有 的 
功能 一 一 Java 本 身 就 具有 许多 基于 正则 表达 式 的 功能 。 正 则 表达 式 也 是 将 以 高 级 程序 语言 
(如 Java) 编写 的 程序 编译 成 机 器 语言 过 程 的 第 一 步 。 更 重要 的 是 ， 正 如 我 们 强调 的 那样 ， 
正则 表达 式 是 在 解决 关于 计算 的 基本 问题 的 道路 上 的 第 一 步 。 

一 般 来 说 ， 我 们 都 知道 可 以 用 一 条 正则 表达 式 来 规范 的 任何 一 种 语言 都 是 正则 语言 一 一 
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这 是 我 们 的 定义 。 但 是 以 某 种 其 他 方式 规范 的 语言 呢 ? 所 有 回 文 组 成 的 一 个 集合 是 正则 语言 
吗 ? 本 节 的 目标 之 一 是 提高 你 对 语言 分 类 的 理解 。 虽 然 有 很 多 有 趣 且 有 用 的 正则 语言 的 例 
子 ， 但 还 有 很 多 有 趣 且 有 用 的 语言 不 属于 正则 语言 。 后 面 ， 我 们 会 介绍 一 个 比 正 则 表达 式 更 
强大 的 规范 系统 来 解决 非 正则 语言 的 问题 。 

正则 表达 式 的 识别 问题 。 正 如 我 们 所 说 ， 另 一 个 根本 问题 是 : 给 定 一 个 二 进 制 字符 串 ， 
我 们 要 如 何 才 能 知道 这 个 字符 串 是 否 属于 给 定 的 正则 表达 式 所 规范 的 语言 呢 ? 例如 ， 字 符 串 
abaaabbbbbbabaabbba 是 否 属 于 正则 表达 式 (ab*|bab)*(bb*b|(b(a|b)))* 规范 的 语言 呢 ? 这 是 一 
个 正则 语言 识别 问题 的 例子 。 正则 表达 式 的 一 大 特点 在 于 它 能 够 帮助 我 们 解决 一 大 类 语言 
(正则 语言 ) 的 精确 描述 问题 ， 但 是 它们 并 没有 解决 这 些 语 言 的 识别 问题 。 当 然 ， 我 们 需要 
先 解决 在 正则 语言 中 的 识别 问题 ， 然 后 才能 解决 在 更 加 困难 的 类 别 语言 之 中 的 这 个 问题 。 就 
比如 所 有 素数 组 成 的 集合 或 者 所 有 Java 程序 组 成 的 集合 中 的 这 个 问题 。 

我 们 将 在 本 节 的 后 面 用 抽象 机 器 来 介绍 一 个 解决 正则 语言 识别 问题 的 方法 。 事 实 上 ， 
可 以 使 用 Java String 库 中 的 matches() 方法 实现 一 个 简单 的 解决 方案 ， 所 以 我 们 首先 描述 怎 
么 实现 。 如 果 s 表示 任意 一 个 Java 字符 串 并 且 re 表示 任意 一 个 正则 表达 式 ， 那 么 如 果 s 属 
于 被 re 所 规范 的 语言 则 s.matches(re) 为 真 ， 否 则 为 假 。 程 序 5.1.1 使 用 这 种 方法 来 解决 识 
别 问 题 : 它 采 用 正则 表达 式 作为 命令 行 参 数 ， 对 于 每 一 个 符合 标准 输入 的 字符 串 ， 如 果 这 
个 字符 串 属于 被 正则 表达 式 所 规范 的 语言 ， 则 打印 Yes， 如 果 不 属 于 则 打印 No。 轻 松 执行 
此 类 检查 的 能 力 非常 有 用 ， 所 以 在 回 到 理论 介绍 之 前 ， 我 们 会 先进 行 一 些 扩展 和 范 化 ， 以 
便 你 能 更 好 地 熟悉 正则 表达 式 。 同 时 我 们 还 会 向 你 介绍 一 些 Java 标准 库 中 不 可 或 缺 的 编程 
区 其 

除了 识别 问题 ， 正 则 表达 式 提 供 的 完整 和 精确 的 规范 会 立即 将 我 们 引导 到 其 他 几 
个 自然 而 明确 的 问题 。 例 如 ， 给 定 两 个 正则 表达 式 ， 我 们 如 何 检 查 它 们 是 否 规范 了 相同 
的 语言 。 我 们 很 容易 就 能 够 检查 出 a(blablaab) 和 (alaa)(blab) 规范 了 相同 的 语言 ， 但 是 
((abblbaaa)*(ba*|b*a))* 规范 的 语言 和 (ab*|bab)*(bb*bla(alb)))* 相同 吗 ? 这 个 问题 是 正则 语 
言 的 等 价 问题 ( equivalence problem)。 你 会 如 何 处 理 那些 可 以 复杂 到 几 千 个 符号 长 度 的 正则 
表达 式 ? 同样 的 ， 当 我 们 从 字典 中 查询 8 个 字母 长 度 且 中 间 两 个 字母 为 hh 的 单词 时 ， 我 们 
会 求 两 种 语言 的 交集 (intersection)， 即 同时 属于 两 种 语言 的 字符 串 。 正 则 表达 式 让 我 们 可 以 
精确 地 定义 这 样 的 问题 ， 但 是 解决 这 些 问 题 是 完 完全 全 另 一 回 事 。 如 果 你 发 现 这 些 问 题 令 你 
着 迷 (很 多 人 都 这 样 )， 你 很 可 能 会 对 计算 理论 的 进一步 学 习 乐 在 其 中 。 这 些 问题 仅仅 是 冰 
山 一 角 而 已 。 

广义 的 正则 表达 式 ” 我们 对 正则 表达 式 的 定义 是 一 个 包括 了 用 于 描述 正则 语言 的 四 个 基 
本 运算 符 (连接 、 并 集 、 闭 包 和 分 组 ) 的 最 小 的 集合 。 在 实践 中 ,我 们 经 常 对 这 个 集合 进行 
各 种 各 样 的 扩展 。 在 这 里 ,我 们 简要 介绍 在 Java 中 发 现 的 一 些 正 则 表达 式 的 扩展 ， 主 要 分 
为 三 大 类 : 

。 对 符号 集 进行 扩展 

。 求 并 集 操 作 的 缩写 符号 

。 对 闭 包 运算 符 的 扩展 

为 了 简洁 起 见 ， 我 们 将 Java 的 正则 表达 式 称 为 广义 RE 或 者 Java RE， 这 两 者 之 间 不 需 
要 做 更 精细 的 区 分 。 在 其 他 语言 和 其 他 应 用 中 也 广泛 定义 了 类 似 的 机 制 ， 但 是 “广义 ”的 确 
切 定 义 是 如 何 构成 的 并 没有 一 个 统一 的 说 法 。 
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程序 5.1.1 有效 性 检查 《正则 表达 式 识 别 ) 


public class Validate 










public static void main(String[] args) 







String re = args[0]; 
while (!StdIn.isEmptyO)) 
{ 











String s = StdIn.readString(); 
if (s.matches(re)) StdOut.println("[Yes]"); 
else StdOut.println("[No]"); 











这 个 程序 说 明了 Java 中 使 用 正则 表达 式 的 机 制 : Java String 库 中 的 matches() 
方法 解决 了 正则 表达 式 的 识别 问题 。main0) 函 数 将 正则 表达 式 作 为 命令 行 参数 ， 
对 于 标准 输入 的 每 个 字符 串 ， 如 果 它 符合 正则 表达 式 描述 的 语言 规范 ， 打 印 Yes， 
否则 打印 No。 













% java Validate "(alb)*a(alb)(alb) (alb) (alb)" 
bbbabbbb 
[Yes] 


[Yes] 
% java Validate "a*|(a*ba*ba*ba*)*" 
bbbaababbaa 


% java Validate "GCG(CCGG|AGG)*CTG" 
[Yes] 
[No] 






所 有 的 广义 概括 都 具有 一 个 共同 特征 ， 就 是 每 个 广义 的 正则 表达 式 都 描述 了 一 种 正则 
语言 。 也 就 是 说 ,( 在 原则 上 ) 你 可 以 将 任何 一 个 广义 RE 转换 为 一 个 像 我 们 前 面 一 直 在 提 的 
标准 正则 表达 式 〈 可 能 形式 上 会 更 为 烦琐 )。 这 个 限制 是 具有 讽刺 意味 的 ， 因 为 广义 正则 表 
达 式 实际 上 并 没有 将 正则 语言 广义 化 ， 而 仅仅 是 一 种 用 来 描述 正则 语言 的 语言 。 在 适当 的 时 
候 ， 我 们 会 介绍 真正 的 广义 化 。 同 时 ， 我 们 需要 注意 ， 许 多 系统 (包括 Java) 支持 的 正则 表 
达 式 扩展 不 是 严格 遵守 这 个 限制 的 。 我 们 稍 后 将 回 到 这 个 话题 。 

符号 集 。 符 号 集 的 扩展 和 广义 化 是 最 明显 的 。Java 正则 表达 式 中 的 符号 是 没有 任何 限制 
的 Unicode 字符 。 但 是 当 我 们 完全 以 这 种 方式 来 对 符号 集 进行 扩展 时 ， 我 们 会 磁 到 一 个 固有 
的 问题 一 一 我 们 需要 一 个 转 义 机 制 ( escape mechanisms) 来 让 我 们 可 以 将 元 符号 |、*、( 和 ) 
与 出 现在 语言 字母 表 中 的 符号 区 分 开 来 。 具 体 来 说 ， 用 \| 表示 |、\* 表示 *、\( 表示 (人 S、\) 
表示 )。 在 后 面 描述 的 其 他 扩展 中 ， 在 将 所 使 用 的 元 符号 当 作 语 言 符 号 来 使 用 的 时 候 ， 都 需 
要 加 “\” 转 义 。 

缩写 符号 。 符 号 集中 有 了 大 量 符号 后 会 立即 产生 对 符号 缩写 的 需求 ， 以 满足 我 们 通过 
一 组 特殊 符号 来 描述 一 系列 复杂 的 语言 。 例 如 ， 通配符 (.) 可 以 用 于 表示 符号 集中 的 任意 符 
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号 ; 它 可 以 是 一 个 符号 集中 所 有 符号 求 并 集 操作 所 得 的 一 长 串 符号 的 缩写 。 例 如 ， 当 处 理 十 
进 制 数字 时 ， 比 起 输入 0|1|2|3|4|516|7|8|9， 我 们 当然 更 愿意 直接 输入 通配符 “.”。 广义 RE 
提供 了 一 些 类 似 这 样 的 缩写 ， 例 如 : 

。 元 符号 ^ 表 示 一 行 的 开头 ， 而 $ 表示 一 行 的 结尾 。 

。 用 方 括号 ([]) 包含 一 个 列表 或 者 范围 ， 用 于 表示 这 个 列表 或 范围 的 所 有 符号 。 

。 如 果 方 括号 中 的 第 一 个 字符 是 ^， 则 指 的 是 不 在 这 个 列表 或 范围 内 的 字符 。 

。 由 反 斜 杠 后 面 跟着 字符 组 成 的 若干 个 转 义 字符 用 于 表示 一 些 特殊 含义 的 字符 。 例 如 ， 

\s 表示 空格 符 。 

例如 ，^text$ 表示 单词 “text” 独 占 一 行 ，[a-z] 表示 所 有 小 写字 母 ，[0-9] 表示 十 进 制 数字 ， 
[^aeiou] 表示 不 是 小 写 元 音 的 字母 , [A-Z][a-z]* 表示 首 字 母 大 写 后 跟 若 干 个 小 写字 母 组 成 的 字符 串 。 

闭 包 。 闭 包 操 作 实 在 是 太 宽泛 了 ， 所 以 很 难 在 实际 应 用 中 直接 使 用 。 因 此 ，Java RE 有 
下 面 这 些 选项 来 对 重复 的 次 数 进行 限制 : 

。 一 次 或 者 更 多 (+) 

。 零 或 一 次 (?) 

。 精 确 n 次 ({n}) 

。 处 于 m 和 7 之 间 ({m,n}) 

例如 ，[Aaeiou]{6} 表示 不 包含 小 写 元 音字 母 的 、 由 6 个 字母 组 成 的 单词 ， 如 rhythm 和 syzygy。 

这 些 符号 中 的 每 一 个 都 是 标准 正则 表达 式 的 缩写 ， 尽 管 一 个 正则 表达 式 可 能 会 非常 长 。 
例如 [^aeiou] 这 个 广义 正则 表达 式 是 一 个 对 所 有 非 元 音字 符 求 并 集 得 到 的 字符 串 的 缩写 ， 而 
[^aeiou]{6} 是 该 字符 串 长 度 为 6 的 缩写 。 从 原理 上 考虑 ， 你 可 能 会 认为 Java 处 理 广 义 RE 
的 方式 是 首先 将 它们 转换 为 一 个 长 的 标准 正则 表达 式 来 处 理 ; 在 实践 中 ， 每 个 扩展 都 是 在 对 
算法 设计 进行 优化 的 基础 上 实现 的 。 
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3 个 字符 8 个 字符 
一 个 广义 正则 表达 式 的 解剖 

从 这 里 开始 往 后 你 会 遇见 许多 的 Java RE， 我 们 在 后 面 会 给 出 一 些 示 例 。 像 前 面 一 样 ， 
你 的 任务 是 认真 学 习 这 些 例 子 中 的 每 一 个 ， 想 想 为 什么 给 出 的 例子 在 描述 的 语言 里 ， 而 其 他 
的 字符 串 不 在 ， 并 尝试 了 解 正 则 表达 式 如 何 完成 它们 的 工作 。 

应 用 “那么 我 们 应 该 如 何在 实际 应 用 中 使 用 正则 表达 式 呢 ? 这 些 正 则 表达 式 出 现在 许多 
场景 中 ， 其 中 的 一 些 我 们 现在 就 会 介绍 。 从 根本 上 说 ， 这 些 方案 都 是 通过 用 相对 较 短 的 正则 
表达 式 来 描述 相对 较 大 (甚至 无 穷 ) 的 字符 串 集合 ， 从 而 实现 简化 描述 。 通 过 使 用 正则 表达 
式 ， 一 个 人 或 一 个 程序 可 以 将 一 整个 字符 串 集合 当成 一 个 整体 。 

有 效 性 检查 。 程 序 5.1.1 对 于 广义 RE 是 有 效 的 (并 且 更 为 有 用 )。 你 可 能 不 知道 在 你 使 
用 网 络 的 时 候 你 经 常 遇 到 正则 表达 式 识别 问题 。 当 你 在 商业 网 站 上 输入 一 个 日 期 或 者 是 一 个 
账号 的 数字 时 ， 输 入 处 理 程序 必须 检查 你 的 输入 是 否 是 正确 的 格式 。 执 行 此 类 检查 的 一 种 方 
法 是 写 一 段 代码 来 检查 所 有 的 情况 : 如 果 你 要 输入 钱 数 (单位 为 美元 )， 代 码 可 能 会 检查 你 
输入 的 首 个 符号 是 不 是 $、 你 的 $ 符号 后 面 跟 的 是 不 是 一 组 数字 等 。 而 更 好 的 办 法 是 定义 一 
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个 正则 表达 式 以 能 够 描述 所 有 合法 输入 组 成 的 集合 。 然 后 ， 检 查 你 的 输入 是 否 合法 这 个 问题 
会 精确 地 转化 为 一 个 正则 表达 式 识别 问题 : 

你 输入 的 字符 串 在 正则 表达 式 描 述 的 语言 里 % java Validate "\\\$[1-9][0-9]*\\. [0-9][0-9]" 

吗 ? 用 于 常见 检查 类 型 的 正则 表达 式 库 在 网 。。 3” 

络 上 已 经 有 很 多 了 ， 因 为 这 种 类 型 的 检查 已 。 fe 

经 被 广泛 地 使 用 了 。 通常 来 说 ， 一 个 正则 表 % java Validate "ATGC...)+(TAG|TAA|TGA)" 


ATGCGCCTGCGTCTGTACTAG 
达 式 比 检 查 所 有 可 能 情况 的 程序 更 能 精确 且 [Yes] 
ATGATTGTAG 


简洁 地 表达 出 所 有 有 效 字符 串 的 集合 。 下 面 [No] 
的 几 个 例子 很 好 地 说 明了 这 一 点 。 





正则 表达 式 在 语言 中 
Unicode 
Java 标 识 符 ( 部 分 ) [$_a-zA-Z] [$_a-zA-Z0-9]* $5 
System 
村 XYZQ@yahoo .com 
电子 邮件 地 址 (部 分 ) [a-zA-Z]+@([a-zA-Z]+\.)+... tea edu 
ed tehouse.gov 
十 进 制 数字 加 分 隔 符 i 
刁 三 A rg: 有 330-12-3456 
美国 社会 安全 号 码 [0-9] {3}-[0-9] {2}-[0-9] {4} 213-44-5689 
图] 和 To (800) 555-1212 
美国 电话 号 码 \([0-9] {3}\) [0-9]{3}-[0-9]{4} (609) 258-4345 
Fm 2 $22.99 
美元 数量 ( 部 分 ) $[1-9] [0-9]*\. [0-9] [0-9] $1000000.00 
$0.01 
基因 编码 
ATGATGATGATGTGA 
潜在 的 基因 ATG(...)+(TAG|TAA|TGA) ATGAAATAG 
ATGCGCCTGCGTCTGTACTAG 
氨基 酸 
CH ;型 锌 指 C. {2,41C. [LIVMFYWCX] .f8TH.13 ,5 CCCCCCCCCCCCCCCCHHHHH 
结构 域 特征 : 下 CAASCGGPYACGGWAGYHAGWH 


基于 不 同 符号 集 的 广义 正则 表达 式 的 示例 


计算 生物 学 。 正 如 我 们 已 经 看 到 的 ， 研 究 人 员 已 经 开发 了 许多 编码 方式 ， 以便 
于 我 们 对 基因 数据 进行 操作 和 分 析 。 我 们 前 面 提 到 的 (基于 ATCG 符 号 集 ) 基因 编 
码 方 式 最 简单 ; 另 一 种 方法 是 使 用 标准 的 单字 母 编码 来 表示 氨基酸 ， 这 个 编码 使 用 
二 “ACDEFGHIKLMNPQRSTVWY”20 个 字母 组 成 的 符号 集 。 有 关 生 物 学 方面 的 科学 理论 在 本 
733| ” 书 中 不 会 涉及 ,但 是 这 里 有 一 个 使 用 这 种 编码 的 例子 ;一 个 CH 型 锌 指 结构 域 特征 被 定义 为 : 
。 一 个 C 后 面 跟 两 个 、 三 个 或 者 四 个 氨基 酸 ; 
。 后面 紧 接 : 和 
。 后 面 紧 接 : L、 [< V、 有 F、Y、W、C 或 者 X 其 中 一 个 后 面 跟从 个 氨基 酸 ; 
。 后 面 紧 接 : H pe 、 四 个 或 者 五 个 氨基 酸 ; 
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。 后 面 紧 接 : H。 

不 难 想到 ,广义 正则 表达 式 : C.{2,4}C...[LIVMFYWCX].{8}H.{3,5}H 能 够 更 为 紧凑 地 
表达 出 这 个 定义 。 例 如 ， 字 符 串 CAASCGGPYACGGWAGYHAGWH 是 一 个 CH 型 锌 指 结 
构 域 ， 因 为 它 以 如 下 方式 组 成 : 

。C 后面 跟 AAS (在 二 到 四 个 氨基 酸 之 间 ); 

。 后 面 紧 接 : C 后 面 跟 GGP (三 个 氨基 酸 ); 

。 后 面 紧 接 : Y (一 个 属于 集合 {L，I，V，M，F，Y，W，C，XTy 的 氨基 酸 )， 后 面 跟 

ACGGWAGY ( 八 个 氨基 酸 ); 

。 后 面 紧 接 : HH 后 面 跟 AGW (在 三 到 五 个 氨基 酸 之 间 ); 

。 后 面 紧 接 : H。 

对 于 这 个 广义 RE， 我 们 可 以 使 用 程序 5.1.1 来 测试 给 定 的 字符 串 是 否 是 一 个 CH 型 锌 
指 结构 域 : 


% java Validate "C.{2,4}C...[LIVMFYWCX] . {8}H. {3,5}H" 
CAASCGGPYACGGWAGYHAGWH 

[Yes] 

CAASCGGPYACGYGWAGYHAGWH 

[No] 





搜索 。 在 现代 计算 机 系统 中 ,我 们 看 起 来 总 是 在 使 用 搜索 这 个 功能 。 你 肯定 对 在 网 页 
上 进行 搜索 、 查 找 文 件 和 使 用 各 种 应 用 程序 内 置 的 基于 字符 串 进行 搜索 的 功能 感到 非常 熟 
悉 。 你 常用 的 方式 很 可 能 是 输入 一 个 字符 串 ， 然 后 寻找 与 这 个 字符 串 相 匹配 的 项 。 有 了 正则 
表达 式 ， 你 可 以 更 灵活 且 更 精确 地 进行 搜索 。 对 于 计算 机 科学 家 来 说 ， 一 个 名 为 grep 的 搜 
索 工 具 是 一 个 有 用 的 软件 工具 。 这 个 工具 由 肯 “ 汤普森 (Ken Thompson) 在 20 世纪 70 年 代 
为 UNIX 系统 开发 ， 并 且 在 现代 的 大 部 分 计算 机 系统 中 仍然 被 当 作 一 个 常用 命令 使 用 。 程 序 
5.1.2 是 使 用 Java 内 置 工具 实现 grep 的 一 种 方案 ， 作 为 一 个 过 滤器 ， 它 以 正则 表达 式 作为 命 
令 行 参 数 ， 若 标准 输入 中 包含 符合 正则 表达 式 语 言 的 子 字符 串 ， 则 在 标准 输出 打印 这 一 行 。 

我 们 可 以 使 用 Grep (或 者 内 置 的 grep) 来 快速 完成 各 种 搜索 任务 ， 比 如 : 

。 查找 所 有 包含 特定 标识 符 的 代码 行 。 

。 查找 字典 中 符合 某 种 模式 的 所 有 单词 。 

。 查找 基因 组 中 包含 某 种 模式 的 片段 。 

。 查找 某 个 演员 出 演 过 的 电影 。 

。 从 一 个 数据 文件 中 提取 包含 特定 字符 的 行 。 

。 以 及 许多 其 他 的 任务 。 

本 节 的 练习 当中 提供 了 在 各 种 领域 运用 搜索 的 例子 ， 你 肯定 会 对 其 中 的 某 一 些 领 域 感 兴趣 。 
即使 是 习惯 于 做 这 些 练习 的 经 验 丰富 的 程序 员 ， 他 们 仍然 会 发 现 grep 是 一 个 不 可 缺少 的 工具 。 
现在 许多 高 级 应 用 程序 都 内 置 了 搜索 功能 ,使 得 用 户 常 常 忽视 了 基于 正则 表达 式 匹 配 的 搜索 。 

通过 信息 来 进行 验证 和 搜索 都 是 一 些 基 本 操作 ， 采 用 广义 RE 来 进行 这 些 操 作 比 不 使 用 
广义 RE 会 简单 很 多 。 我 们 使 用 这 些 例子 是 为 了 说 明 ， 理 解 和 使 用 正则 表达 式 是 任何 想 要 有 
效 利用 计算 的 人 必须 做 到 的 事情 。 在 现代 科学 ， 工 程 和 商业 应 用 中 都 充斥 着 大 量 的 数据 ， 所 
以 运用 模式 匹配 工具 的 技能 在 我 们 的 成 长 中 发 挥 着 重要 的 作用 。 正 如 我 们 在 程序 5.1.1 和 程 
序 5.1.2 中 所 阐释 的 ，Java 工具 让 在 一 个 应 用 中 包含 正则 表达 式 的 搜索 变 得 容易 (同样 适合 
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于 其 他 现代 编程 环境 )， 所 以 你 可 能 会 发 现 对 正则 表达 式 的 应 用 正在 飞速 增长 。 

更 重要 的 是 ， 正 则 表达 式 展现 了 一 个 基本 范式 。 这 个 想法 的 基本 概念 是 先 用 一 个 形式 规 
则 来 描述 一 种 语言 ， 然 后 识别 一 个 给 定 的 字符 串 是 否 属于 给 定 的 语言 。 要 想 充 分 了 解 它 ， 你 
首先 要 了 解 识别 过 程 的 工作 原理 。 

为 了 有 效 地 使 用 正则 表达 式 ， 我 们 需要 解决 识别 问题 。 思 考 一 下 如 果 不 用 Java 的 
matches() 方法 ， 你 会 如 何 实现 程序 5.1.1 ? 即使 对 于 二 进 制 符号 集 上 的 基本 正则 表达 式 也 应 
该 如 此 。 那 么 我 们 如 何 编写 一 个 程序 ， 以 一 个 正则 表达 式 和 一 个 字符 串 为 输入 ， 并 判断 该 字 
符 串 是 否 在 正则 表达 式 定义 的 语言 中 呢 ? 为 了 解决 这 个 问题 ,我们 开始 走 上 研究 计算 机 科学 


中 核心 基本 概念 的 道路 。 









程序 5.1.2 ”广义 RE 模式 匹配 


public class Grep 
{ 





public static void main(String[] args) 










String re = args[0]; 
while (StdIn.hasNextLine()) 
攻 

String line = StdIn.readLine() ; 

if (line.matches(".*" + re + ".*")) 
System.out.printin(line); 
















这 个 程序 实现 了 经 典 的 软件 工具 grep: 它 采用 正则 表达 式 作 为 它 的 参数 车 
标准 输入 中 包含 符合 正则 表达 式 语言 的 子 字符 串 ， 则 打印 标准 输出 行 。 为 了 简单 
起 见 ， 这 个 实现 中 使 用 了 Java String 库 中 的 matches0 方 法 ; Java 中 的 Pattem 和 和 Mathcer 
类 可 以 为 复杂 的 正则 表达 式 和 巨大 的 文件 提供 更 有 效 的 实现 方法 :( 见 程序 7.2.3 ) 。 
文件 words.txt 可 以 在 本 书 官网 上 找到 ， 这 个 文件 包含 了 字典 里 的 所 有 单词 ， 每 个 
一 行 。 在 4.$ 节 里 有 对 文件 movies.txt 的 描述 。 


% java Grep class < Grep.java 
public class Grep 


% java Grep "A[tuv][def] [wxy].$" < words .txt 
text 

% java Grep "A...hh...$" < words.txt 
withheld 

withhold 

% java Grep "Bacon, Kevin" < movies.txt | java Grep "Sedgwick, Kyra" 
Murder in the First (1995)/ .. /Bacon, Kevin/ ... /Sedgwick, Kyra 
Woodsman, The (2004)/ .. /Bacon, Kevin/ ... /Sedgwick, Kyra 


抽象 机 器 ”为 了 解决 诸如 正则 表达 式 的 识别 等 问题 ， 
我 们 想 出 了 一 个 简单 的 计算 模型 。 起 初 ， 这 个 模型 在 你 
看 来 与 正则 表达 式 完 全 无 关 ， 但 是 请 你 放心 ， 这 是 解决 
这 些 问题 的 第 一 步 。 

抽象 机 器 是 一 个 形式 语言 识别 问题 的 计算 模型 。 最 
普遍 的 情况 下 ， 抽 象 机 器 不 过 是 一 个 将 输入 的 一 个 字符 
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串 映射 到 单个 输出 位 的 数学 函数 。 我 们 通常 会 考虑 一 个 更 为 详细 的 模型 ， 将 输入 符号 分 开 考 
虑 并 逐个 处 理 。 具 体 来 说 ， 对 于 任何 给 定 的 形式 语言 ， 我 们 设想 这 么 一 个 设备 ， 这 个 设备 与 
外 部 设备 的 接口 有 三 个 组 成 部 分 : 一 个 开关 ， 一 个 可 以 一 次 从 纸 带 中 读 取 (也 可 能 是 写 入 ) 
一 个 符号 的 输入 /输出 设备 ， 以 及 至 少 两 个 状态 的 指示 灯 ( Yes 和 No)。 我 们 将 一 个 给 定 的 
字符 串 放 入 纸 带 以 备 加 载 ， 然 后 打开 机 器 。 这 时 我 们 和 希望 机 器 能 够 读 取 输 入 纸 带 上 的 内 容 ， 
并 且 如 果 读 到 的 字符 串 在 这 个 机 器 的 形式 语言 中 , 指示 灯 “ Yes” 亮 起 ， 如 果 不 是 的 话 指示 
灯 “No” 亮 起 。 如 果 指 示 灯 “Yes” 亮 起 ,我们 说 机 器 “接受 ”这 个 字符 串 ， 或 者 说 这 个 字 
符 串 匹 配 ， 如 果 指 示 灯 “No” 亮 起 ， 我 们 说 机 器 “拒绝 ”这 个 字符 串 或 者 这 个 字符 串 不 匹 
配 。 因 此 ， 一 个 抽象 机 器 描述 了 一 种 形式 语言 〈 它 所 接受 的 所 有 字符 串 的 集合 ) 并 为 该 语言 
的 识别 问题 提供 了 一 个 抽象 的 解决 方案 〈 将 一 个 字符 串 放 在 纸 带 上 ， 打 开机 器 并 查看 “Yes” 
指示 灯 是 否 亮 起 )， 这 就 是 我 们 常 说 的 一 台 机 器 可 以 识别 一 种 语言 。 我 们 将 思考 一 些 抽象 机 
器 ， 这 些 机 器 在 操作 纸 带 的 能 力 以 及 输入 /输出 设备 和 指示 灯 的 可 用 性 方面 有 所 不 同 。 

我 们 现在 关注 的 是 抽象 机 器 在 计算 理论 中 的 使 用 ,但 是 你 应 该 注意 到 这 个 做 法 是 合理 
的 ， 因 为 抽象 机 器 适合 对 所 有 类 型 的 实际 计算 问题 进行 建 模 。 例 如 ， 当 你 使 用 自动 取款 机 
时 ， 你 按 按钮 的 顺序 队列 会 对 应 一 个 输入 字符 串 ， 接 受 指示 符 对 应 你 的 钱 已 经 被 发 放 的 情 
况 ， 拒 绝 指 示 符 对 应 你 收 到 一 个 金额 不 足 的 提示 。 或 者 我 们 考虑 这 么 一 种 情况 ， 输 入 的 字符 
串 是 一 个 十 进 制 整数 ， 并 且 我 们 希望 机 器 在 当 且 仅 当 这 个 整数 为 素数 时 亮 起 “ Yes” 指 示 符 
(否则 就 在 纸 带 上 写 入 它 的 最 大 因数 )。 我 们 在 本 书 开头 提 到 的 Java 程序 的 总 览 也 可 以 看 作 
一 个 抽象 机 器 。 这 个 想法 很 普遍 ， 它 包括 了 我 们 可 能 会 遇 到 的 任何 类 型 的 计算 。 我 们 将 在 本 
章 中 更 具体 地 介绍 一 些 其 他 例子 。 

一 台 抽 象 机 器 要 如 何 决定 是 点 亮 “Yes” 指 示 灯 还 是 “No” 指 示 灯 呢 ? 我 们 希望 这 人 台 
机 器 必须 读 取 部 分 或 全 部 输入 并 进行 一 些 计算 。 那 么 应 该 进行 什么 样 的 计算 呢 ? 抽象 机 器 的 
特征 是 由 我 们 为 它 定义 的 基本 操作 所 决定 的 。 我 们 的 目标 是 剥离 那些 不 必要 的 细节 ， 并 专注 
于 研究 那些 最 简单 的 机 器 ， 这 些 机 器 仅 使 用 尽 可 能 简单 的 一 组 基本 操作 。 

抽象 机 器 是 专用 型 的 计算 机 。 在 本 节 中 ， 我们 专注 于 研究 一 个 机 器 只 解决 一 个 问题 的 模 
型 : 即 某 种 正则 语言 的 识别 问题 。 在 适当 的 时 候 ， 我 们 将 看 到 这 个 概念 如 何 帮助 我 们 了 解 通 
用 计算 机 解决 问题 的 原理 。 使 用 那些 尽 可 能 简单 的 机 器 ， 使 得 我 们 有 可 能 通过 严格 证 明 来 验 
证 这 些 机 器 的 行为 。 正 如 你 将 看 到 的 ， 更 重要 且 更 令 人 惊讶 的 是 ,我 们 能 够 使 用 这 些 简 单 的 
模型 解决 适用 性 非常 广泛 的 问题 。 

确定 有 限 状 态 自 动机 任何 机 器 都 需要 能 够 读 取 一 个 输入 符号 ， 所 以 我 们 首先 研究 一 
种 只 处 理 数据 输入 的 抽象 机 器 ， 这 种 机 器 就 是 所 谓 的 确定 有 限 状态 自动 机 ( Deterministic 
Fnitestate Automaton，DFA )。 每 个 DFA 由 以 下 部 分 组 成 : 

。 一 组 数量 有 限 的 状态 ， 每 个 状态 都 被 指定 为 接受 状态 或 者 拒绝 状态 。 

一 组 迁移 ， 用 于 描述 机 器 如 何 更 改 状 态 。 对 于 符号 集中 的 每 个 符号 ， 每 个 状态 都 存在 
一 个 迁移 。 

一 个 纸 带 阅读 器 ， 这 个 阅读 器 最 初 位 于 输入 字符 串 的 第 一 个 符号 处 ， 并 且 只 能 读 取 一 
个 符号 并 移动 到 下 一 个 符号 处 。 

我 们 将 每 个 DFA 表示 为 一 个 图 ， 其 中 接受 状态 为 标记 为 “Yes” 的 顶点 ,拒绝 状态 为 
标记 为 “No” 的 顶点 ， 并 且 每 个 迁移 都 是 一 条 有 向 边 ， 边 上 标记 符号 集中 的 一 个 符号 。 为 
了 区 分 这 些 顶 点 ,我 们 用 从 0 开始 的 整数 来 对 它们 进行 编号 。 这 里 有 一 个 基于 二 进 制 符 号 集 
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的 DFA 的 例子 。 这 个 DFA 使 用 符号 b 和 a 作为 符号 集 符号 以 避免 与 顶点 的 索引 产生 混淆 。 
为 了 简化 描述 ， 如 果 我 们 有 多 个 符号 能 够 引起 相同 的 迁移 ， 我 们 将 其 表示 为 一 条 边 ， 并 在 这 
条 边 上 用 一 个 包含 了 所 有 会 引起 这 个 迁移 的 符号 组 成 的 字符 串 来 标记 。 
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操作 符 。 所 有 的 DFA 都 从 状态 0 开始 ， 开 始 时 它 的 一 个 
输入 字符 串 放 在 纸 带 上 ， 此 时 磁头 位 于 输入 字符 串 中 最 左 侧 
的 符号 上 。 机 器 根据 下 列 规则 以 分 步骤 进行 操作 并 同时 改变 
状态 : 读 取 一 个 符号 ， 将 磁头 右 移 一 个 位 置 ， 然 后 根据 刚刚 读 
取 的 输入 字符 的 迁移 标签 来 进行 状态 迁移 。 当 输入 全 部 读 取 完 
时 ，DFA 停止 操作 。 如 果 停 留 的 位 置 是 一 个 接受 状态 ， 指 示 
灯 Yes 亮 起 ; 如 果 该 点 是 一 个 拒绝 状态 ， 指 示 灯 No 亮 起 。 

例如 对 于 我 们 示例 的 DFA， 给 它 一 个 输入 字符 串 bbaab 
将 有 如 下 表现 (如 右 图 所 示 ): 从 状态 0 开始 ， 它 读 取 第 一 个 b 
并 移动 到 状态 1。 然 后 读 取 第 二 个 字符 并 移动 到 状态 2， 因 为 
那个 符号 是 b。 然 后 它 停留 在 状态 2, 因为 第 三 个 和 第 四 个 符 
号 都 是 a， 然 后 移动 到 状态 0， 因 为 第 五 个 符号 是 b。 当 输入 
全 部 读 取 完毕 时 ， 机 器 处 于 0 状态 。 状 态 0 标记 的 是 Yes， 所 
以 它 会 激活 Yes 指示 灯 。 换 句 话说 ， 这 台 机 器 接受 了 二 进 制 字 
符 串 bbaab。 通 过 这 些 步骤 还 可 以 看 出 ， 机 器 拒绝 了 三 进 制 字 
符 串 b、bb、bba 和 bbaa。 

对 于 这 些 步骤 的 一 个 更 紧凑 的 表示 是 DFA 在 尝试 决定 是 
接受 还 是 拒绝 这 个 二 进 制 字符 串 时 所 生成 的 状态 迁移 序列 ， 这 
个 序列 的 最 终 状态 表示 这 个 二 进 制 字符 串 是 被 接受 还 是 拒绝 。 
对 于 我 们 的 例子 ， 序 列 0->1->2->2->2->0 就 是 这 个 DFA 对 于 
输入 字符 串 bbaab 的 步骤 序列 。 请 注意 ， 我 们 可 以 根据 状态 迁 
移 序 列 来 推断 输入 字符 串 。 

描述 语言 的 特征 。 哪 些 二 进 制 字符 串 在 一 个 给 定 的 DFA 
所 识别 的 语言 中 呢 ? 为 了 回答 这 个 问题 ， 我 们 需要 研究 机 器 的 
行为 来 推断 它 接受 和 拒绝 的 字符 串 。 在 我 们 的 例子 中 ， 你 立刻 
就 能 看 出 来 a 的 数量 是 不 影响 输出 结果 的 ， 所 以 我 们 仅仅 需要 
关心 b 的 数量 。 这 个 机 器 拒绝 b 和 bb 但 是 接受 bbb ; 它 拒绝 
bbbb 和 bbbbb 但 是 接受 bbbbbb (并 且 和 忽略 了 所 有 a 的 数量 )， 
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所 以 我 们 有 理由 得 出 这 么 一 个 结论 ， 这 个 DFA 识别 的 语言 是 b 的 数量 是 3 的 倍数 。 通 过 提 
出 一 个 完整 的 证 明 来 验证 我 们 的 结论 并 不 困难 ， 只 需要 针对 输入 数据 的 位 数 来 进行 数学 归纳 
法 证 明 。 不 同位 数 的 读 取 结 果 如 下 : 当 且 仅 当 b 被 读 取 的 数量 为 3 的 倍数 时 ， 机 器 处 于 状态 
0， 当 且 仅 当 b 被 读 取 的 数量 为 3 的 倍数 加 1 时 ， 机 器 处 于 状态 1， 当 且 仅 当 b 被 读 取 的 数 
量 为 3 的 倍数 加 2 时 ， 机 器 处 于 状态 2 ( 见 练习 5.1.3 )。 


最 少 有 三 个 b 







AN 
No~b—> No ~b—> No ~b—> Yes 


a 





小 于 三 个 b 


i Mt 


Yes— b—>Yes—b—> Yes—b— No 





字符 串 中 有 bbb 的 序列 


-Ee 1 2 a 3 
、 


No~b—> No —b—> No —b—>Yes 





更 多 DFA 的 例子 
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更 多 例子 。 左 图 给 出 了 另外 三 个 基于 
二 进 制 符号 集 的 DFA 的 例子 ， 另 外 下 图 还 
给 出 了 一 个 基于 DNA 符号 集 识 别 潜在 基 
因 的 DFA， 还 有 其 他 的 几 个 DFA 我们 会 
在 练习 中 描述 。 对 于 每 个 DFA， 你 要 知道 
它 是 否 识别 出 描述 的 语言 ， 首 先 要 跟踪 它 
的 操作 来 检查 它 是 否 接 受 了 一 些 你 确定 在 
语言 中 的 字符 串 和 拒绝 了 一 些 你 确定 不 在 
语言 中 的 字符 串 ， 然 后 尝试 理解 它 为 什么 
总 是 会 这 样 做 。 

从 这 些 例 子 中 ， 你 要 说 服 自 己 定义 
DFA 是 简单 且 自 然 的 ， 尽 管理 解 它们 的 原 
理 并 不 是 一 个 简单 的 任务 。 因 为 很 容易 定 
义 ，DFA 被 广泛 用 于 解决 多 数 实 际 应 用 中 
重要 的 计算 问题 : 在 文本 编辑 器 中 用 于 模 
式 匹配 ， 在 编译 器 中 用 于 词法 分 析 , 在 网 
页 浏览 器 中 用 于 HTML 解析 ， 在 操作 系统 
中 用 于 图 形 界面 用 户 交 互 ， 以 及 许多 其 他 
的 软件 应 用 。DFA 这 一 抽象 概念 也 足以 描 
述 物理 世界 中 的 控制 单元 ， 如 自动 售 货 机 、 
电梯 、 自 动 交 通信 号 灯 和 计算 机 处 理 器 ， 
更 不 用 说 从 分 子 到 植物 到 人 类 基因 组 的 各 


种 天 然 实体 。 在 所 有 这 些 上 下 文中 ， 我 们 都 认为 一 个 系统 有 一 系列 互 不 影响 的 状态 ， 这 些 状 
态 根据 规则 从 一 个 转变 到 另 一 个 ， 而 这 些 规 则 只 依赖 于 当前 状态 以 及 下 一 个 输入 。 


No 一 A 人 一 No—T— No-G> No—ACG— No 一 ACT No 飞 CT 一 No 一 人 一 No— AG— Yes 


和 





识别 潜在 基因 的 DFA ( 见 程序 3.1.1 ) 


740 


742 
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当 我 们 说 一 个 抽象 机 器 的 时 候 ， 意 思 是 我 们 没有 规定 这 个 机 器 在 物理 世界 中 是 如 何 实现 
的 。 这 个 做 法 让 我 们 可 以 用 不 同 的 DFA 来 表示 不 同 的 情况 。 我 们 完全 可 以 用 一 个 数字 表格 ， 
或 者 一 个 Java 程序 ， 或 者 一 个 电路 ,或 者 一 块 机 械 硬 件 来 实现 一 个 DFA。 事 实 上 ，DFA 适 
用 于 对 可 以 在 自然 界 中 找到 的 所 有 物体 进行 建 模 。DFA 让 我 们 可 以 对 这 些 不 同 的 机 制 的 具 
体 属性 进行 推理 ,无 论 是 真实 的 机 制 还 是 抽象 的 机 制 。 

DFA 的 Java 实现 ”那么 我 们 如 何 建立 DFA 呢 ? 事实 上 没 必 要 这 么 做 ， 因 为 开发 一 个 
被 称 为 通用 虚拟 DFA 的 Java 程序 是 非常 简单 的 。 通 用 意味 着 这 个 DFA 可 以 模拟 任何 DFA 
的 操作 ; 虚拟 意味 着 它 只 是 在 某 台 机 器 上 作为 一 个 程序 实现 ， 而 不 是 一 个 物理 设备 。 程 序 
5.1.3 是 一 个 通用 虚拟 DFA， 它 获取 了 一 个 DFA 规范 (从 命令 行 参 数 指定 其 文件 名 ) 并 且 从 
标准 输入 获得 一 系列 字符 串 ， 并 且 打 印 出 给 定 字符 串 在 DFA 上 运行 的 结果 。 

对 于 一 个 DFA， 文 件 的 输入 格式 是 : 一 个 表示 状态 数目 的 数字 后 面 跟着 符号 集 ， 再 后 
面 跟着 的 每 一 行 表 示 一 个 状态 。 对 于 每 个 状态 所 在 的 行 包含 了 一 个 字符 串 ， 这 个 字符 串 首先 
是 一 个 Yes 或 者 No (用 于 指定 状态 是 否 是 一 个 接受 状态 )， 后 面 跟着 的 是 对 符号 集中 的 每 个 
符号 在 当前 状态 的 迁移 索引 ， 第 i 个 索引 给 出 了 当 DFA 输入 符号 集中 的 第 i 个 符号 时 ， 从 这 
个 状态 要 如 何 进行 迁移 。 程 序 下 方 显 示 的 文件 b3.txt 定义 了 我 们 的 DFA， 这 个 DFA 识别 的 
语言 是 b 的 数量 是 3 的 倍数 。 文 件 gene.txt 定义 了 上 述 用 于 识别 潜在 基因 的 DFA。 

这 个 构造 函数 创建 了 这 些 数 据 结 构 ， 用 于 表示 DFA 的 内 部 构造 ， 而 所 需 的 数据 由 命令 
行 参数 指定 的 文件 给 出 ， 获 取信 息 的 过 程 如 下 : 

。 读 取 状 态 的 数量 以 及 符号 集 。 

。 创 建 一 个 字符 串 数组 ， 用 于 保存 每 个 状态 的 接受 /拒绝 值 ， 以 及 状态 转换 的 符号 表 。 

。 通过 读 取 每 个 状态 的 接受 / 拒绝 值 和 状态 转换 来 填充 这 些 数据 结构 。 

实现 这 个 构造 函数 的 代码 很 简单 : 


public DFA(String filename) 
{ 


In in = new In(filename); 

int n = in.readIntO:; 

String alphabet = in.readString(); 

action = new String[n]; 

next = (ST<Character, Integer>[]) new ST[n]; 

for (int state = 0; state < ni state++) 

* 
action[state] = in.readStringO) ; 
next[state] = new ST<Character, Integer>O; 
for (int i = 0; i < alphabet.length(); i++) 

next[state] .put(alphabet.charAt(i), in.readInt()); 
} 
} 


程序 5.1.3 中 的 其 他 方法 也 很 简单 。simulate() 方法 用 于 对 DFA 的 操作 进行 模拟 ，DFA 
中 的 main() 方法 对 于 每 个 来 自 输入 的 字符 串 调用 simulate() 方法 。 

程序 5.1.3 既是 一 个 DFA 构成 的 完整 规范 ， 也 是 一 个 不 可 缺少 的 研究 特定 DFA 属性 的 
工具 。 你 提供 符号 集 、 一 个 DFA 的 表格 式 描述 以 及 一 系列 输入 字符 串 ， 它 就 会 告诉 你 DFA 
是 否 接受 这 些 字符 串 。 它 实际 解决 了 DFA 的 识别 问题 ， 也 简单 展示 了 对 虚拟 机 器 的 模拟 ， 
稍 后 我 们 还 会 讨论 。 它 不 是 一 个 真正 的 计算 设备 ， 而 是 对 这 种 设备 是 如 何 工作 的 一 个 完整 定 
义 。 你 可 以 将 DFA 视 为 一 台 “ 计 算 机 "， 通 过 描述 一 组 顶点 和 迁移 规则 来 进行 “编程 ”， 而 
这 些 顶 点 的 迁移 条 件 的 设置 要 符合 DFA 的 规则 。 每 个 DFA 都 是 这 台 计 算 机 的 一 个 “程序 ”。 
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程序 5.1.3 ”通用 虚拟 DFA 


public class DFA 
{ 








private String[] action; 
private ST<Character, Integer>[] next; 
public DFA(String filename) 
A 


public String simulate(String input) 
{ 












int state = 0; 

for (int i = 0; i < input:length(); i++) 
state = next[state] .get(input.charAt(i)); 

return action[state]; 






public static void main(String[] args) 










DFA dfa = new DFA(args[0]); 
while (StdIn.hasNextLine()) 
StdOut.printin(dfa.simulate(StdIn.readLine())); 

3 









} 











这 个 程序 对 于 标准 输入 的 每 一 行 字符 串 ， 模 拟 了 由 命令 行 参数 指定 的 DFA 
是 如 何 完 成 识别 过 程 的 。 如 果 字 符 串 在 指定 的 语言 里 面 ， 这 个 程序 打印 Yes; 否 
则 打印 No。 
























% java DFA gene .txt 





% more gene .txt 
二 













入 ATGTCTCTTTAG 
0 1 Yes 
No 110 10 10 
No 十 之 No 10 2 10 10 PE 
No 20 No 
No 10 10 10 3 
% java DFA b3.txt “i ATGCCTCCTCCTTTCTAA 
babbbabb NO 5 5 Yes 
Yes 
| Ve- + ) ATGTAA 
te NO 72 8 Yes 
Neo. 9 glxR 9 ATGAAATAATAA 
Wo $3 No 
0 10 10 10 
0 10 10 10 





不 确定 性 ” 接 下 来 我 们 来 考虑 一 个 对 DFA 模型 的 扩展 。 这 个 模型 与 我 们 通常 想象 的 在 
现实 世界 里 的 计算 机 有 不 同 的 思考 方式 。 为 什么 我 们 要 这 么 做 呢 ? 因为 这 个 模型 不 仅 可 以 创 
造 更 紧凑 、 更 便于 使 用 的 自动 机 ， 还 可 以 帮助 我 们 创建 更 有 益 的 实用 程序 ， 解决 基 础 的 理论 
问题 。 截 至 本 书目 前 所 述 ， 它 代表 了 一 个 DFA 和 正则 表达 式 之 间 的 链接 ， 引 领 我 们 更 充分 
地 理解 正则 表达 式 ， 并 实践 正则 表达 式 识别 问题 的 解决 方案 。 

不 确定 有 限 状 态 自动 机 。 一 个 DFA 的 行为 是 确定 〈deterministic) 的 ， 即 对 于 每 个 输入 
符号 和 每 个 状态 都 只 有 一 个 可 能 的 状态 迁移 。 一 个 不 确定 有 限 自动 机 (NEFA) 是 一 种 有 其 他 
可 能 的 状态 迁移 的 抽象 机 器 。 上 有 具体 来 说 ，NFA 与 DFA 基本 相同 ， 只 是 取消 了 离开 每 个 状态 
的 转换 限制 ， 所 以 : 

。 允许 使 用 相同 的 符号 来 标记 多 个 迁移 。 

。 允许 未 被 标记 的 状态 迁移 ( 空 迁移 ) 存在 。 

。 并非 所 有 符号 都 需要 包含 在 每 个 状态 的 迁移 中 。 
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一 个 NFA 不 仅 可 以 在 没有 读 和 输入 符号 的 情况 下 进行 状态 迁移 ， 而 且 在 给 定 当 前 状态 
和 输入 符号 的 情况 下 它 还 可 以 有 零 个 、 一 个 或 者 多 个 
状态 迁移 与 每 个 状态 和 每 个 输入 符号 相对 应 。 选 择 是 
否 以 及 何 时 进行 迁移 并 未 指定 。 如 果 有 任何 一 个 迁移 
队列 能 让 机 器 从 起 始 状态 (0 ) 转换 为 接受 状态 ， 我 
们 就 认为 这 个 输入 是 合法 的 。 右 图 给 出 了 一 个 NFA 
的 例子 。 当 机 器 处 于 状态 0 并 读 入 一 个 a 时 ， 它 可 以 
选择 保持 在 状态 0 或 者 迁移 到 状态 1。 接 下 来 我 们 分 
析 这 个 机 器 能 识别 哪 种 语言 。 

NFA 识别 举例 。 不 同 于 有 确定 状态 迁移 规则 的 
DFA ， 我 们 需要 做 更 多 的 工作 来 解决 NFA 的 识别 问题 。 假 设 我 们 输入 的 字符 串 是 baaab : 如 
果 你 仔细 研究 一 下 ， 你 会 发 现 NFA 可 以 通过 状态 迁移 序列 0-0-0-1-2 来 接受 这 个 输入 。 它 也 
可 以 做 像 0-1-2 或 者 0-0-0-0 这 样 的 状态 迁移 ， 但 是 这 些 序列 并 不 会 用 尽 输入 字符 串 并 到 达 
一 个 接受 状态 ; 因此 我 们 对 这 些 转 换 不 感 兴趣 。 同 时 ， 很 容易 看 出 ， 如 果 输 入 的 字符 串 是 
bbbb，NFA 就 没有 办 法 从 状态 0 迁移 到 状态 1， 所 以 它 必须 亮 起 No 指示 灯 。 为 了 解决 NFA 
的 识别 问题 ， 我 们 必须 考虑 到 所 有 的 可 能 性 。 这 种 识别 方法 与 DFA 遵循 简单 地 从 一 个 状态 
到 另 一 个 状态 的 规则 大 相 径 庭 。 在 这 个 例子 中 ， 可 以 证 明 我 们 的 示例 NFA 识别 了 所 有 倒数 
第 三 个 符号 为 a 的 字符 串 的 这 种 语言 。 首 先 ， 通过 下 面 的 方法 : 选择 保持 状态 0 直到 读 入 倒 
数 第 二 个 字符 串 ， 此 时 这 个 NFA 读 取 a 并 进入 状态 1， 然后 在 最 后 一 个 符号 读 取 后 进入 状 
态 2( 接 受 状态 )， 这 表示 这 个 NFA 可 以 接受 倒数 第 二 个 符号 是 a 的 任意 字符 串 。 其 次 ， 没 
有 任何 一 个 状态 转换 序列 可 以 让 这 个 NFA 接受 倒数 第 二 个 符号 不 是 a 的 字符 串 ， 因 为 输入 
符号 a 是 到 达 状 态 1 的 唯一 方法 。 

下 图 给 出 的 是 一 个 具有 空 迁 移 的 NFA( 人 允许 在 不 读 入 任何 符号 下 进行 状态 迁移 ) 的 例子 。 
这 让 我 们 更 难 弄 清 一 个 特定 的 NFA 是 否 能 接受 一 个 特定 的 字符 串 ， 更 不 用 说 一 个 特定 的 
NFA 识别 了 哪 种 语言 。 图 中 的 NFA 识别 的 语言 是 不 包含 bba 作为 子 字 符 串 的 所 有 二 进 制 字 
符 串 的 集合 ， 这 可 能 需要 花费 一 些 时 间 来 理解 。 我 们 将 这 种 语言 称 为 不 存在 bba。 

NFA 的 识别 问题 。 我 们 要 如 何 解 决 NFA 的 识别 
问题 呢 ( 即 系统 地 检查 一 个 给 定 的 NFA 是 否 接 受 一 个 
给 定 的 输入 ) ? 对 于 DFA 来 说 ， 这 个 过 程 很 简单 ， 因 
为 每 个 步骤 只 有 一 种 可 能 的 状态 迁移 。 然 而 对 于 NFA 
来 说 ， 我 们 面临 从 大 量 可 能 性 中 找 出 至 少 一 个 状态 迁 
移 序列 。 

在 我 们 定义 NFA 时 ， 我 们 不 需要 规定 自动 机 如 
何 进行 计算 ; 事实 上 ， 也 很 难 想象 我 们 要 如 何 建立 这 
样 一 台 机 器 。 对 于 每 台 机 器 这 看 起 来 都 似乎 是 相当 困 
难 的 工作 ， 因 为 一 台 机 器 不 仅 要 为 在 它 的 语言 里 的 那些 输入 找到 一 个 能 从 起 始 状 态 转 换 到 接 
受 状态 的 迁移 序列 ， 还 要 证 明 对 于 不 在 它 的 语言 里 的 那些 输入 不 会 存在 这 样 的 一 个 序列 。 

一 种 思考 NFA 操作 的 方式 是 猜测 一 个 可 以 到 达 接 受 状态 的 迁移 序列 : 如 果 有 这 样 的 一 
个 序列 ， 那 么 它 会 找到 这 个 序列 。 直 觉 告诉 我 们 机 器 不 能 猜 到 我 们 想 要 它们 计算 的 结果 ,但 
是 非 确 定性 相当 于 我 们 想象 它们 可 以 这 么 做 。 在 类 Java 的 语言 中 我 们 需要 一 个 类 似 于 这 样 


西 个 从 状态 0 离开 的 迁移 
被 同一 个 字符 标记 





不 确定 有 限 自 动机 (NFA) 





一 个 具有 空 迁移 的 NFA 
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的 结构 : 
do either { this statement } or do { that statement }; 


这 样 导致 看 起 来 好 像 非 确定 性 使 我 们 远离 现实 世界 。 那 么 一 个 Java 程序 怎么 决定 要 做 
什么 呢 ? 实际 上 ， 非 确定 性 是 一 个 既 在 实践 中 具有 实用 价值 ， 又 在 理解 计算 的 基本 性 质 方面 
至 关 重 要 的 概念 。 

幸运 的 是 ， 按 下 面 所 示 的 方法 来 跟踪 所 有 可 能 的 状态 转换 ， 以 期 模仿 NFA 的 操作 并 不 
困难 : 

。 首先 我 们 要 找到 所 有 可 以 从 起 始 状态 通过 空 迁移 到 达 的 状态 。 这 是 NFA 在 阅读 第 一 
个 符号 之 前 可 以 到 达 的 所 有 状态 的 集合 。 
查找 可 以 通过 一 条 由 第 一 个 输入 符号 标记 的 边 所 到 达 的 所 有 状态 ,然后 查找 可 以 从 这 
些 状态 中 的 其 中 一 个 通过 空 迁 移 到 达 的 所 有 状态 。 这 是 NFA 在 阅读 第 二 个 符号 之 前 
可 以 达到 的 所 有 可 能 状态 的 集合 。 

。 重复 这 个 过 程 ， 跟 踪 NFA 在 读 取 每 个 输入 符号 之 前 可 以 到 达 的 所 有 状态 ， 直 到 输入 

用 尽 。 

在 此 过 程 结 束 时 ， 如 果 任 何 接 受 状态 处 于 输入 耗 尽 后 留 下 的 状态 集合 中 ， 那么 NFA 就 
会 接受 这 个 输入 字符 串 在 语言 中 的 事实 。 如 果 没 有 任何 接受 状态 处 于 输入 耗 尽 后 留 下 的 状态 
集合 中 或 者 输入 耗 尽 之 前 留 下 的 状态 集合 为 空 ， 则 NFA 会 接受 输入 字符 串 不 在 语言 中 的 事 
实 。 这 些 步骤 是 确定 性 的 : 它们 构成 了 一 种 无 须 任何 猜测 却 能 理解 基于 任何 NFA 的 计算 的 
沪 法 & 





在 读 取 第 个 符号 后 在 读 取 第 i+1 个 符号 在 读 取 下 一 个 符号 之 前 在 读 取 第 计 1 个 符号 后 
所 有 的 可 达 状 态 ™ c 时 可 能 发 生 的 迁移 可 能 发 生 的 空 迁移 所 有 的 可 达 状 态 


模仿 NFA 操作 中 的 一 个 步骤 


NFA 追踪 示例 。 在 下 面 的 例子 中 我 们 考虑 如 下 情况 ,我 们 给 定 一 个 输入 ababb， 对 于 
“不 出 现 bba” 这 个 NFA 研究 其 迁移 过 程 ， 如 下 图 所 示 。 我 们 从 状态 集合 {0,2} 开始 ， 状 态 
0 是 开始 状态 且 有 一 个 空 迁 移 可 以 转换 到 状态 2。 在 读 人 第 一 位 输入 (a) 之 后 可 能 到 达 的 状 
态 集合 仍 为 {0,2}， 因 为 输入 为 a 时 仅 有 的 一 个 迁移 是 从 状态 0 回 到 状态 0,: 然后 也 可 能 再 
以 一 个 空 迁移 转换 到 状态 2。 在 读 取 第 二 位 输入 (b) 之 后 ,我们 可 以 处 于 状态 1 (从 状态 0 
经 过 b 迁移 得 到 ) 或 者 处 于 状态 2 (从 状态 2 经 过 b 迁移 回 到 自身 )。 输 入 的 第 三 位 是 a， 此 
时 唯一 的 可 用 迁移 是 从 状态 集合 {1,2} 回 到 状态 0， 并 且 状 态 0 总 是 可 以 通过 一 个 空 迁 移 转 
换 到 状态 2， 所 以 当 我 们 读 完 第 三 位 时 仅 有 状态 {0,2} 是 可 能 的 结果 。 与 前 面 一 样 ， 在读 完 
第 四 位 后 会 得 到 一 个 b, 将 我 们 从 状态 {0,2} 迁移 到 状态 {1,2}， 然 后 在 读 完 第 五 位 之 后 ， 字 
符 b 使 得 状态 2 自 迁移 到 状态 {2}。 既 然 这 是 已 经 耗 尽 了 输入 并 处 于 状态 2 (一 个 接受 状态 )， 
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我 们 认为 这 个 NFA 将 接受 ababb (而 且 我 们 可 以 展示 出 机 器 会 做 出 的 状态 转换 序列 : 0-0-1- 


0-2-2-2 )。 如 果 输 入 再 加 上 一 个 额外 的 a， 在 读 取 完 之 后 可 
能 到 达 的 状态 集合 会 变 成 空 (因为 在 读 取 完 第 五 位 之 后 唯 
一 的 可 能 状态 为 状态 2， 并 且 状 态 2 没有 以 a 为 输入 的 迁 
移 )， 所 以 ababba 会 被 这 个 NFA 拒绝 。 

对 于 DFA 来 说 ， 我 们 在 程序 5.1.3 中 通过 一 步 一 步 模 
拟 DFA 操作 的 方式 得 到 了 一 个 DFA 识别 问题 的 解决 方案 。 
为 了 在 NFA 中 做 到 同样 的 事情 ， 我 们 使 用 了 与 刚刚 提 到 的 
跟踪 过 程 相同 的 方法 : 我 们 在 程序 计数 器 中 跟踪 了 一 组 状 
态 而 不 是 跟踪 单个 状态 ， 这 组 状态 是 在 读 完 纸 带 上 当前 的 
符号 之 后 ，NFA 可 以 到 达 的 所 有 状态 的 集合 。 我 们 将 这 个 
方案 的 实现 留 在 了 练习 题 部 分 。 让 机 器 能 猜 出 正确 答案 的 
想法 是 一 个 幻想 ,但 是 能 研究 和 使 用 非 确 定性 的 程序 让 这 
个 想法 变 得 像 是 真 的 一 样 。 同 样 的 ;我 们 可 以 将 这 个 Java 
程序 看 成 一 个 “NFA 计算 机 ”， 并 将 每 一 个 NFA 看 成 这 个 
计算 机 的 一 个 “程序 ”。 一 台 计 算 机 被 赋予 对 该 做 的 事情 进 
行 猜测 的 能 力 ， 它 是 否 比 DFA 计算 机 一 一 程序 5.1.3 中 的 
通用 虚拟 DFA 更 强大 ? 存 有 这 样 的 疑问 是 合理 的 。 

克 林 定 理 在 正则 表达 式 ，DFA 和 NFA 之 间 有 着 惊 
人 的 联系 ， 这 个 联系 具有 重大 的 实践 和 理论 意义 。 这 个 联 
系 被 称 为 克 林 定 理 (Kleene’s theorem)， 它 以 在 1951 年 建 
立 了 自动 机 和 正则 语言 之 间 联 系 的 逻辑 学 家 史蒂芬 " 克 林 
(Stephen Kleene) 的 名 字 来 命名 。 


ee 


st ee 


. > 1 和 ie ss sr i A 入 eT 


克 林 定理 是 我 们 要 介绍 的 第 一 个 主要 定理 ， 所 以 有 必 
要 对 一 些 数 学 证 明 的 思路 进行 说 明 。 在 这 个 介绍 中 ， 我们 
没有 用 标准 的 数学 方式 来 陈述 和 证 明定 理 。 我 们 提出 一 个 
定理 陈述 的 目的 是 为 了 让 你 意识 到 这 是 一 个 重要 事实 ,我 
们 提出 一 个 证 明 框 架 的 目的 是 让 你 相信 这 个 定理 为 真 。 我 
们 会 给 出 每 个 证 明 背 后 的 意图 以 及 足够 让 你 理解 这 个 证 明 
的 细节 ， 这 样 那些 对 这 个 证 明 感 兴趣 的 人 可 以 补 全 证 明 的 
剩余 部 分 。 我 们 的 第 一 个 证 明 是 有 建设 性 的 ， 也 许 这 个 证 





跟踪 NFA 的 操作 


明 比 其 他 类 型 的 证 明 〈 比 如 那些 更 依赖 于 逻辑 原理 的 证 明 方 式 ) 更 容易 检查 ， 因 为 我 们 给 出 
了 一 些 例子 来 展示 证 明 的 过 程 。 尽 管 示例 并 不 比 测试 用 例 更 能 证 明 程序 是 有 效 的 ， 它 们 仍然 
是 有 必要 的 第 一 步 。 如 果 你 读 了 一 个 证 明 ， 然 后 研究 了 一 个 例子 ， 再 重读 这 个 证 明 ， 你 会 发 
现 更 容易 让 自己 理解 这 个 定理 的 真实 性 。 虽 然 你 比 一 个 训练 有 素 的 数据 家 更 容易 被 说 服 , 但 


也 请 你 相信 我 们 不 会 误导 你 。 
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证 明 策 略 。 根 据 定 义 ， 如 果 我 们 可 以 写 出 一 个 正则 表达 式 来 描述 一 个 语言 ， 那 么 这 个 语 
言 是 正则 语言 。 任 何 正则 表达 式 都 描述 了 一 个 正则 语言 。 为 了 证 明 克 林 定 理 ， 我 们 想 要 证 骨 
这 个 定义 对 于 DFA 和 NFA 同样 如 此 。 我 们 将 分 两 步 进行 : 首先 我 们 证 明 DFA 和 NFA 是 等 
价 的 ， 然 后 我 们 证 明 NFA 和 正则 表达 式 是 等 价 的 。 

NFA 和 DFA 是 等 价 的 。 每 个 DFA 都 是 一 个 NFA。 如 果 我 们 对 于 任意 一 个 NFA 可 以 构 
建 一 个 DFA， 其 与 给 定 的 NFA 具有 相同 的 语言 ， 那 么 就 可 以 证 明 两 者 之 间 是 等 价 的 。 首 
先 ， 对 于 每 一 个 可 能 的 NFA 状态 集合 ， 这 个 DFA 都 有 一 个 状态 与 之 对 应 这 意味 着 如 果 这 
个 NFA 有 nn 个 状态 ， 那么 这 个 DFA 可 能 有 2” 个 状态 。 对 于 一 个 给 定 的 NFA， 在 它 读 取 了 
输入 中 任意 给 定 的 部 分 之 后 ， 都 有 一 个 唯一 可 能 的 状态 集合 ， 所 以 这 个 DFA 可 以 处 理 所 有 
可 能 出 现 的 情况 。 为 了 和 弄 清楚 转换 过 程 ， 我 们 使 用 与 我 们 讨论 NFA 的 操作 时 相同 的 描述 方 
法 。 对 于 一 组 给 定 的 NFA 状态 集合 和 一 个 输入 符号 ， 我 们 从 原 集合 中 任意 一 个 NFA 状态 出 
发 ， 通 过 这 个 符号 标记 的 边 和 任意 数量 的 空 边 ， 从 整个 NFA 状态 集合 中 挑选 出 那些 可 达 的 
NFA 状态 ， 组 成 一 个 新 的 NFA 状态 集合 。 这 个 NFA 状态 集合 对 应 于 我 们 正在 构建 的 DFA 
中 的 单个 状态 ， 并 且 这 个 状态 就 是 我 们 的 迁移 目 
标 。 对 于 DFA 中 的 每 个 状态 和 符号 集中 的 每 个 符 
号 ,我 们 都 可 以 通过 这 种 方式 计算 出 结果 。 简 便 起 
见 ， 我 们 可 以 忽略 DFA 中 那些 从 状态 0 无 法 到 达 
的 状态 。 最 后 我 们 将 每 个 与 NFA 中 包含 接受 状态 
的 状态 集合 相对 应 的 DFA 状态 都 定义 为 接受 状态 。 

右边 的 例子 展现 了 根据 NFA 构建 DFA 的 过 
程 。 这 个 NFA 的 作用 是 识别 倒数 第 二 个 字符 为 a 
的 二 进 制 字符 串 ， 它 有 三 个 状态 ， 所 以 这 个 DFA ”NFA 到 DFA 的 转换 表 


应 该 被 构造 成 拥有 八 个 状态 ， 每 个 都 在 图 表 中 注 明 下 
与 哪个 NFA 状态 对 应 : ( 空 状态 ), 0，1, 2 ( 单 状 i 0 
态 子 集 ),01,029,12 (两 个 状态 的 子 集 ) 和 012 (所 村 认购 Se 2 
有 三 个 状态 )。 对 于 这 些 状态 中 的 每 一 个 ,我 们 都 其 作 区 上 
可 以 为 每 个 输入 符号 来 决定 它 的 结果 。 例 如 ; -在 状 i 
态 为 01 的 时 候 给 定 一 个 输入 符号 a， 我们 可 以 从 a 2 
0-0、0-1 或 者 1-2 这 些 NFA 迁移 中 任意 选择 一 个 ， 012 Yes 012 02 


所 以 对 于 进行 迁移 的 状态 01 在 DFA 中 的 后 继 者 识别 (alb)*a(alb) 的 DFA 
状态 为 012 ; 同样 的 ， 如 果 在 状态 为 01 的 时 候 输 

入 的 符号 是 b， 我 们 可 以 从 0-0 或 1-2 这 两 个 NFA 
迁移 中 任意 选择 一 个 ， 所 以 对 于 进行 b 迁移 的 状态 
01 在 DFA 中 的 后 一 状态 为 02。 图 中 的 转换 表 给 出 
了 需要 用 这 种 方式 来 分 析 的 八 种 可 能 性 。 注 意 状 态 
1 和 状态 12 没有 作为 任何 一 条 边 的 目标 状态 出 现 
过 ; 状态 2 只 能 从 这 两 个 状态 中 的 其 中 一 个 到 达 ， 
状态 5 只 能 从 状态 2 和 自身 到 达 ， 所 以 这 些 都 是 从 从 一 个 NFA 转换 为 一 个 DFA 


日 原 书 错误 。 一 一 译 者 注 
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状态 0 无 法 到 达 的 状态 ， 我 们 可 以 在 DFA 中 忽略 它们 。 

为 了 相信 DFA 和 NFA 是 等 价 的 ， 你 需要 确信 原则 上 对 于 每 个 NFA 你 都 可 以 完成 以 上 
过 程 (即使 在 某 些 情况 下 可 能 因为 状态 太 多 而 令 人 感到 乏味 )。 你 可 以 在 练习 中 找到 其 他 例 
子 。 注 意 ， 在 有 空转 换 的 NFA 中 ， 你 需要 做 的 第 一 件 事 就 是 计算 起 始 状态 〈 见 练习 5.1.14 )。 

简 而 言 之 ;没有 任何 形式 语言 是 可 以 被 某 些 NFA 识别 但 是 不 能 被 DFA 识别 的 。 你 可 能 
会 有 一 个 先 人 为 主 的 想法 ， 即 : NFA 机 器 会 比 DFA 功能 更 强大 ,但 事实 并 非 如 此 。 它 们 有 
着 相同 的 计算 能 力 。 

NFA 与 正则 表达 式 是 等 价 的 。 为 了 构建 一 个 正则 表达 式 ， 其 能 够 描述 被 任何 给 定 的 
NFA 识别 的 语言 ， 我 们 可 以 进行 以 下 步 又 : 

。 扩展 nNFA 模型 ， 以 使 得 边 上 的 标记 可 以 是 正则 表达 式 。 

。 设置 一 个 起 始 状 态 ， 以 使 其 空 边 可 以 到 达 NFA 的 起 始 状态 ; ;设置 一 个 结束 状态 ， 以 

使 从 每 个 接受 状态 都 可 以 经 过 空 边 到 达 它 。 
。 一 次 从 NFA 中 删除 一 个 状态 ， 把 这 个 状态 所 代表 的 功能 用 更 复杂 的 正则 表达 式 和 相 
应 的 边 代 替 ， 直 到 只 剩 下 起 始 状态 和 结束 状态 ， 这 两 个 状态 之 间 通 过 一 条 用 正则 表达 


式 标记 的 边 相 连接 。 
a a 
®_ We 转 一 时 
\ b b / 
起 始 结束 





— a @ 
将 一 个 NFA 转化 为 一 个 正则 表达 式 
我 们 用 来 移 除 状态 的 三 个 基本 操作 在 下 面 说 明 。 为 了 简单 起 见 ， 例 子 上 用 的 都 是 单 符号 
标记 的 边 ; 换 成 正则 表达 式 同 样 是 有 效 的 。 而 且 它们 没有 考虑 到 从 其 他 边 进 入 和 退出 顶点 来 
移 除 状态 的 可 能 性 。 但 是 我 们 总 是 可 以 分 四 步 以 从 任何 扩展 的 NFA 移动 任意 状态 x: 


— b 
@:—@'—® @ BD _®@ ta 
-+—® —ab:c ve 
访 二 Galbc~ 僵 
将 一 个 顶点 从 一 个 扩展 NFA 中 删除 的 三 种 方式 
。 用 “|” 结 合 从 相同 来 源 进 入 x 的 边 。 
。 用 “ 市 结合 从 x 离开 并 且 到 相同 目的 地 的 边 。 
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。 前 序 操作 中 离开 x 的 操作 最 多 有 一 个 自 循环 (将 它 标记 为 R)。 对 于 每 一 对 出 / 人 该 状 
态 的 边 (将 它们 分 别 标记 为 S 和 DD)， 创 造 一 条 标记 为 SR*D 的 新 边 ， 这 条 边 的 来 源 
为 原 人 边 的 来 源 ， 目 的 地 为 原 出 边 的 目的 地 (这样 就 能 跳 过 x)。 

。 删 除 x 和 所 有 进入 及 离开 它 的 边 。 

左 图 是 这 个 基本 操作 的 一 个 例子 。 我 们 很 容易 就 能 

R ,全 。 。 验 证 这 些 操作 会 产生 一 个 与 原始 NFA 等 价 的 NFA。 新 的 
@:-@” NFA 可 能 会 比 原始 NFA 有 更 多 的 边 ( 当 一 个 顶点 有 mm 条 
人 边 和 条 出 边 时 ， 我 们 用 m*n 条 边 来 代替 这 个 顶点 和 

那些 边 ), 更 少 的 状态 。 因 此 我 们 可 以 应 用 这 些 操作 直到 


® 没有 状态 剩 下 (仅仅 剩 下 一 条 边 )。 在 这 条 边 上 的 标签 就 
SDs 是 能 描述 被 这 个 NFA 识别 的 语言 的 正则 表达 式 。 前 面 的 
SR*D, 示例 展示 了 将 一 个 NFA 转换 为 一 个 正则 表达 式 的 步骤 ， 


这 个 NFA 规定 的 是 倒数 第 二 个 符号 为 a 的 二 进 制 字符 
将 一 个 存在 两 条 出 边 的 NFA 节点 删除 串 。 这 个 过 程 足够 详细 ， 我 们 可 以 编写 Java 程序 来 完成 

这 个 转换 ， 但 是 在 这 里 我 们 关心 的 仅仅 是 证 明 : 你 可 以 
将 任何 一 个 NFA 转换 为 一 个 正则 表达 式 ， 用 来 描述 这 个 NFA 识别 的 语言 。 

如 果 把 相同 的 步骤 反 过 来 ， 我 们 就 可 以 构建 一 个 NFA， 这 个 NFA 可 以 识别 与 给 定 正 则 
表达 式 描 述 相同 的 语言 。 我 们 从 一 个 简单 的 只 有 一 条 用 正则 表达 式 标记 的 边 的 NFA 开始 工 
作 ， 通 过 添加 状态 来 化 简 边 上 的 正则 表达 式 直 到 每 条 边 上 的 标签 都 为 a、b 或 者 没有 标签 ， 
从 而 构建 一 个 NFA。 我 们 从 一 个 单 状态 的 扩展 NEFA 开始 ， 这 个 NFA 只 有 一 条 由 给 定 正则 表 
达 式 标记 的 人 边 和 出 边 。 现 在 ， 每 个 拥有 特殊 标签 的 边 必须 满足 (R)、RS、RIS 或 者 Rx 中 
的 一 种 (R 和 S 都 是 正则 表达 式 )， 因 此 我 们 可 以 按照 下 面 任 一 方式 进行 简化 : 

。 如 果 一 条 边 标记 为 (R)， 将 括号 删除 。 

。 如 果 一 条 边 标记 为 RS， 将 这 条 边 蔡 换 为 一 个 新 的 状态 和 两 条 新 的 边 ， 一 条 从 源 状态 

到 新 状态 的 边 标记 为 R， 另 一 条 从 新 状态 到 目的 地 的 边 标记 为 S。 
。 如 果 一 条 边 标记 为 RIS， 则 用 平行 的 两 条 边 代替 这 条 边 ， 其 中 一 条 标记 为 R， 另 一 条 
标记 为 S。 
。 如 果 一 条 边 标 记 为 R*， 则 用 没有 标签 的 边 

和 标记 为 R 的 自 循环 边 来 代替 这 条 边 。 人 alba ~@® 

这 些 构造 方法 都 会 生成 一 个 扩展 NFA， 这 个 
扩展 NFA 能 识别 与 源 NFA 相同 的 语言 并 且 简 化 了 b+~®@ 
一 些 边 ， 所 以 我 们 可 以 继续 使 用 以 上 构造 方法 直 
到 每 一 条 边 都 标记 为 空 、a 或 者 b， 这 样 就 得 到 了 pe 


一 个 NFA。 右 图 描绘 了 这 种 构造 方法 的 一 个 例子 。 
其 与 将 一 个 NFA 转换 为 一 个 正则 表达 式 的 过 程 基 @ 证 a=> 人 :~® 


本 相同 。 同 样 的 ， 你 需要 做 一 些 在 本 节 结 尾部 分 的 


练习 来 让 你 自己 相信 ， 可 以 用 这 种 方法 来 对 任意 一 六 a 
个 给 定 的 正则 表达 式 建立 一 个 NFA。 ©_e 他、 局 
我 们 已 经 确定 了 DFA、NFA 和 正则 表达 式 


是 等 价 的 〈 克 林 定 理 )。 任 何 可 以 被 正则 表达 式 、 将 一 个 正则 表达 式 转换 为 一 个 NFA 
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DFA 和 NFA 描述 的 语言 都 是 正则 的 ,任何 一 个 正则 语言 都 可 以 被 正则 表达 式 、DFA 和 NFA 
描述 。 我 们 详细 地 描述 这 个 定理 的 证 明 ， 可 以 让 你 了 解 到 抽象 机 器 的 这 种 思维 ， 即 使 是 最 简 
单 的 机 器 也 可 能 带 来 令 人 惊讶 的 理论 结果 ( 非 确 定性 并 不 会 增强 DFA 的 能 力 )， 并 向 你 介绍 
一 个 有 趣 又 有 用 、 好 理解 的 计算 模型 ， 以 及 向 你 描述 一 种 简单 有 效 的 基本 方法 ， 这 些 方法 可 
以 用 来 支持 一 些 计算 理论 中 基础 并 且 深 刻 的 思想 。 

我 们 还 有 一 件 需 要 注意 的 事 : 我 们 一 直 在 关注 做 这 些 迁 移 的 可 能 性 ; 但 是 做 这 些 事 的 
成 本 完全 就 是 男 一 回 事 。 例如， 与 一 个 具有 7n 个 状态 的 NFA 对 应 的 DFA 可 能 有 2” 个 状态 
事实 上 ， 在 我 们 的 例子 中 ， 我 们 都 知道 没有 一 个 少 于 2”-1 个 状态 的 DFA 可 以 识别 “ 在 最 后 
n 位 只 有 一 个 a 的 二 进 制 字 符 串 ”这 种 语言 。 当 n 较 大 时 ， 这 个 代价 是 过 高 而 且 无 法 实施 的 。 
我 们 现在 可 以 知道 正则 表达 式 、DFA 和 NFA 可 以 做 什么 , 但 实际 应 用 中 我 们 需要 将 成 本 也 
一 并 考虑 。 我 们 会 在 5.5 节 中 回 到 这 个 话题 。 

克 林 定 理 的 应 用 ” 克 林 定 理 既 是 一 个 重要 的 理论 成 果 ， 也 可 以 直接 应 用 于 实践 。 接 下 来 
我 们 会 介绍 两 个 克 林 和 定理 的 重要 应 用 ， 一 个 例子 从 理论 出 发 ， 另 一 个 从 实践 出 发 。 

正则 表达 式 识 别 。 这 个 理论 的 基本 实践 应 用 是 作为 解决 正则 表达 式 识别 问题 的 基础 : 给 
定 一 个 正则 表达 式 和 一 个 字符 串 ， 这 个 字符 串 在 被 正则 表达 式 描述 的 语言 中 吗 ? 我 们 对 克 林 
定理 的 证 明 是 有 建设 性 的 ， 所 以 它 为 构建 一 个 解决 正则 表达 式 的 识别 问题 的 程序 提供 了 一 个 
直接 的 途径 : 

。 构建 一 个 与 给 定 正则 表达 式 相 对 应 的 NFA。 

。 在 给 定 的 输入 字符 串 上 模拟 NFA 的 操作 。 

这 就 是 前 面 一 节 我 们 讲 到 的 ，Java 实现 match() 方法 时 首先 会 采取 的 方案 。 这 个 实现 需 
要 特别 注意 确保 计算 的 代价 在 可 控 范围 内 。 你 可 以 在 我 们 写作 的 男 一 本 书 《 算 法 》( 第 4 版 ) 
中 找到 完整 的 描述 和 实现 。 下 例 是 一 个 计算 机 科学 领域 的 基础 范例 : 

。 选择 一 个 中 间 抽 象 概念 (在 这 个 例子 中 为 NFA)。 

。 建立 一 个 模拟 器 来 使 抽象 概念 具体 化 。 

。 构建 一 个 编译 器 ， 来 将 问题 转换 为 抽象 概念 。 

这 个 过 程 就 是 将 Java 程序 编译 成 Java 虚拟 机 所 需要 的 程序 的 过 程 (这 些 Java 虚拟 机 程 
序 本 身 也 是 一 个 抽象 概念 ， 并 且 最 终 用 那些 为 特定 计算 而 编写 的 低级 语言 程序 来 模拟 )。 

DFA 能 力 的 限制 。 克 林 定 理 还 帮助 我 们 揭示 了 一 个 基本 的 理论 问题 : 哪 种 形式 语言 5 
以 被 一 个 正则 表达 式 描 述 ,， 以 及 哪些 不 能 ? 

要 解决 这 个 问题 ,我 们 首先 考虑 “所 有 a 的 数量 和 的 数量 相等 的 字符 串 ” 这 种 语言 。 
至 少 这 种 语言 看 起 来 与 我 们 在 本 节 介 绍 过 的 许多 其 他 语言 一 样 简单 。 我 们 可 以 写 出 一 个 描述 
这 个 语言 的 正则 表达 式 吗 ? 我 们 当然 可 以 开动 自己 的 想象 试 试看 ， 但 事实 上 这 种 语言 是 非 正 
则 的 ， 所 以 没有 办 法 用 一 个 正则 表达 式 来 描述 它 。 

我 们 怎样 才能 证 明 这 样 一 个 结果 呢 ? 克 林 定 理 使 得 我 们 可 以 不 用 对 正则 表达 式 表达 事 
物 进行 直接 推理 ， 而 是 用 抽象 机 器 代替 。-: 由 克 林 定 理 建立 的 正则 表达 式 、DEA 和 NFA 的 等 
价 关 系 意 味 着 ， 我 们 可 以 使 用 它们 之 中 的 任意 三 个 来 表示 一 个 正则 语言 的 概念 。 在 这 个 例子 


[5353| 中 , 我 们 使 用 DFA。 


不 是 所 有 的 形式 语言 都 是 正则 的 。 A et 
”证 明 : 采用 反 证 法 ， rr 
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的 一 一 我 们 可 以 写 出 描述 它 的 正则 表达 式 。 由 克 林 定 理 知 ， 我 们 可 以 建立 一 个 能 识别 这 
种 语言 的 DFA。 设 DFA 中 的 可 以 接受 “ a 的 数量 与 b 的 数量 相等 ”的 状态 数量 为 xn。 具 
体 来 说 ， 它 能 识别 一 个 字符 串 ， 这 个 字符 串 由 一 个 有 个 a 符号 的 序列 和 一 个 用 个 b 
符号 的 序列 组 成 。 现 在 让 我 们 来 研究 一 下 这 个 DFA 在 接受 这 个 字符 串 时 它 访问 的 状态 的 
轨迹 。 因 为 DFA 只 有 nn 个 状态 ， 所 以 由 抽 层 原理 ( pigeonhole principle) 知 ， 这 个 DFA 
在 读 取 a 时 必须 重复 访问 一 个 或 多 个 状态 ， 因 为 在 轨迹 中 有 n+ 1 个 状态 ( 含 开 始 状 态 )。 
例如 当 n 为 10 时， 轨迹 可 能 如 下 所 示 : 


abbbbbbbbbb 
57 本 2-9-628-72827 


-在 这 个 例子 中 ， 状 态 3 会 在 第 六 次 转换 时 重复 。 现 在 ， 我 们 可 以 通过 从 原始 字符 串 
中 在 每 对 重复 状态 之 间 去 除 相应 的 a 来 构造 不 同 的 输入 字符 串 。 在 上 面 的 例子 中 ,我 们 | 
将 去 除 3-5-2-9-7-3 中 的 5 个 a 字符 串 ， 然后 我 们 可 以 通过 减少 轨迹 来 得 到 这 个 字符 囊 的 
轨迹 ， 如 下 所 示 : 

a a aiaab bb bbbb bbb 

0-3-5-2-9-7-1-5-4-2-9-6-8-7-8-7 

”观察 得 到 的 关键 结果 是 ，DFA 的 第 二 大 
束 。 因 此 它 也 接受 了 第 二 个 输入 。 但 是 这 个 输入 中 a 的 数量 比 b 要 少 ， 这 与 我 们 所 做 的 
假设 “ DFA 能 识别 这 个 语言 ” 相 矛 盾 。 这 个 假设 是 从 我 们 存在 一 个 可 以 描述 这 种 语言 的 “ 
正则 表达 式 得 来 的 ， 因 此 ， er 
相等 ”这 不 语言 : 


这 个 证 明 有 两 个 值得 你 关注 的 证 明 技 巧 。 第 一 个 是 反 证 法 (proof by contradiction)， 即 
为 了 证 明 一 个 陈述 是 真 的 ,我们 首先 假设 它 是 假 的 。 然 后 我 们 逐步 进行 逻辑 推理 得 出 一 个 错 
误 的 结论 。 为 了 使 这 个 结论 成 立 ， 原 假设 必须 是 错误 的 ; 也 就 是 说 ， 这 个 陈述 必须 是 真 的 。 
第 二 个 证 明 技 巧 是 抽 层 原理 : 假设 有 n+ 1 只 蚀 子 进入 nn 个 或 更 少 的 蚀 子 洞 ， 那 么 必须 有 一 
些 角子 洞 是 有 多 于 一 只 鸽子 在 里 面 的 。 如 果 你 缺少 进行 数学 证 明 的 经 验 ; 你 应 该 带 着 这 些 技 
巧 重新 阅读 一 遍 证 明 过 程 。 

仅仅 展示 一 个 非 正 则 语言 不 足以 完成 整个 证 明 , 但 是 这 个 证 明 的 技巧 适用 于 许多 其 他 语 
言 ， 并 且 能 帮助 我 们 理解 正则 语言 的 特征 是 什么 。 许 多 有 用 的 简单 语言 都 是 非 正则 的 。 

功能 更 强大 的 机 器 。 更 重要 的 是 ,， 非 正则 语言 带 给 我 们 另 一 个 关键 问题 : 将 抽象 机 器 模 
型 扩展 成 可 以 识别 这 种 简单 语言 的 机 器 的 最 简单 方法 是 什么 ? 根据 克 林 定理 ， 即 使 是 具备 非 
确定 性 功能 也 无 济 于 事 。 当 我 们 找到 这 么 一 个 模型 时 ， 我 们 首先 需要 了 解 这 个 模型 中 的 机 器 
能 够 识别 的 语言 集合 的 边界 在 哪里 、 极 限 在 哪里 。 

有 限 状态 自动 机 的 根本 限制 是 它们 的 状态 是 有 限 的 ， 所 以 它们 能 跟踪 的 事物 的 数量 是 有 
限 的 。 在 上 面 的 例子 中 ， 自 动机 无 法 辨别 有 10 个 a 字 符 的 输入 字符 串 和 只 有 5 个 a 的 输入 
字符 串 之 间 的 差异 。 一 个 简单 的 克服 这 个 缺陷 的 方法 是 给 DFA 增加 一 个 下 推 栈 ,得 到 一 个 
下 推 自动 机 ( Pushdown Automaton，PDA)。 通 过 将 多 余 的 符号 保存 在 栈 里 ， 我 们 不 难 构建 
一 个 可 以 识别 a 和 的 数量 相等 这 种 语言 的 PDA ( 见 练习 5.1.44 )。 有 一 种 语言 被 称 为 上 下 
文 无 关 语言 ( context-free language)， 这 种 语言 简单 、 易 于 理解 且 非 常 有 用 , - 它 与 PDA 能 识 
别 的 那些 语言 相似 。 例如， 所 有 可 能 的 正则 表达 式 都 是 一 个 上 下 文 无 关 语 言 ， 同 时 也 是 Java 
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的 一 个 核心 子 集 。 


有 没有 不 能 被 PDA 识别 的 语言 呢 ? 有 没有 DFA 
比 PDA 更 强大 的 自动 机 呢 ? 是 的 ， 这 样 的 语言 
和 机 器 是 存在 的 。 你 可 能 会 期 望 有 一 个 长 长 的 
机 器 模型 的 列表 ， 列 表 上 的 每 个 机 器 都 比 上 一 
个 机 器 有 更 强大 的 功能 ， 但 是 这 个 列表 实际 上 
很 得。 事实 上 ， 我 们 将 在 下 一 节 看 到 ， 给 机 器 
增加 第 二 个 栈 就 可 以 使 得 机 器 像 任何 人 想象 的 
那样 强大 。 

总 结 ”正则 表达 式 、DFA 和 NFA 是 用 于 描 
述 被 称 为 正则 语言 的 一 些 语言 的 等 效 模型 。 这 
种 关系 让 我 们 可 以 证 明正 则 语言 的 一 些 特性 ， 
并 开发 一 些 程序 ， 利 用 它们 的 特性 来 完成 各 种 
基本 计算 任务 。 

现实 中 存在 很 多 非 正 则 但 是 十 分 有 趣 的 
语言 一 一 哪 种 形式 化 的 机 制 可 以 定义 它们 呢 ? 
是 否 有 不 能 用 这 些 更 普遍 的 机 制 来 描述 的 语言 
呢 ? 这 些 类 型 的 问题 和 语言 之 间 的 关系 、 用 于 
描述 它们 的 形式 化 方法 ， 还 有 通过 克 林 定 理 演 
示 的 抽象 机 器 ， 都 为 我 们 在 本 章 开 头 提出 的 问 
题 提 供 了 更 丰富 的 相关 知识 : 

。 有 些 计 算 机 本 质 上 就 比 其 他 计算 机 更 强大 吗 ? 

。 哪些 问题 可 以 用 一 台 计 算 机 解决 呢 ? 

。 计算 机 的 极限 在 哪 ? 

在 本 节 中 ， 我们 彻底 解决 了 有 限 自动 机 器 的 这 些 问题 ,通过 这 些 问 题 我 们 可 以 精确 定 
义 简单 的 抽象 计算 机 。 在 解决 这 些 问题 时 ， 我 们 考虑 了 大 量 这 些 简单 抽象 模型 的 实际 应 用 情 
况 ， 而 且 我 们 又 增加 了 两 个 基本 问题 : 

。 计算机 和 语言 之 间 的 关系 是 什么 ? 

。 非 确定 性 会 使 机 器 变 得 更 强大 吗 ? 

接 下 来 ,我 们 会 通过 考虑 这 些 问题 来 获得 更 强大 的 计算 模型 。 我 们 需要 考虑 的 模型 只 比 
DFA 和 NFA 稍微 复杂 一 些 ， 但 是 它们 适合 所 有 已 知 的 计算 设备 。 这 些 计算 模型 构成 了 计算 
机 科学 的 核心 。 
问答 环节 

问 : 符号 的 定义 是 什么 ? 

答 : 符号 是 形式 语言 的 基本 抽象 构件 。 从 一 个 数学 家 的 角度 来 看 ， 符 号 的 定义 并 没有 什 
么 区 别 : 对 形式 语言 的 研究 就 是 对 符号 序列 集合 的 研究 。 从 科学 家 或 工程 师 的 角度 看 ， 符 号 
是 至 关 重 要 的 ， 因 为 它们 构成 了 形式 语言 抽象 世界 与 我 们 使 用 形式 语言 的 真实 世界 之 间 微 弱 


的 联系 。 一 个 符号 可 能 是 真实 世界 中 的 任何 一 个 东西 ， 比 如 一 个 触发 器 、 一 个 基因 、 一 个 神 
经 元 、 一 个 分 子 ， 或 者 是 抽象 世界 中 的 任何 一 个 东西 ， 比 如 一 位 、 一 个 数字 、 一 个 小 写字 母 
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或 者 一 个 Unicode 符号 。 

问 : 交集 也 是 集合 的 基本 操作 之 一 。 为 什么 不 把 交集 也 作为 正则 表达 式 基 本 定义 的 一 部 
分 呢 ? 

答 : 这 是 个 好 问题 。 由 于 语言 仅仅 是 一 些 集合 ， 所 以 很 多 东西 可 以 从 集合 理论 延续 到 
正则 表达 式 中 。 你 可 以 为 语言 定义 交集 ， 而 且 两 个 正则 语言 的 交集 语言 也 是 正则 的 〈 见 练习 
.1.37 

问 : 那些 用 于 指定 元 符号 的 转 义 字符 有 点 令 人 困惑 。 可 以 使 用 缩写 来 描述 它们 吗 ? 

答 : 恰恰 相反 ， 只 会 写 得 更 长 。 当 你 在 Java 字符 串 文 本 里 描述 一 个 正则 表达 式 时 ， 你 
需要 另 一 个 级 别 的 转 义 来 转 义 字符 元 符号 。 例 如 ， 你 需要 输入 “\Ns” 来 代表 一 个 空格 字符 ， 
输入 “\N” 来 代表 一 个 单 斜 杠 字 符 。 有 时 候 你 需要 对 命令 行 中 的 特殊 字符 进行 转 义 。 例 如 ; 
美国 货币 的 正则 表达 式 ， 它 的 命令 行 参数 使 用 了 “\\$” 来 表示 一 个 美元 符号 ,使 用 “\\.” 
来 表示 一 个 小 数 点 。 

问 : 学 习 NFA 有 什么 意义 ?它们 比 DFA 更 难 想象 ， 我 不 清楚 它 的 优势 在 哪 。 

答 : 我 们 使 用 NFA 来 证 明 克 林 定 理 ， 并 且 使 用 它们 可 能 实现 正则 表达 式 识别 问题 。 另 
一 个 原因 是 NFA 往往 比 DFA 拥有 更 少 的 状态 。 尝 试 为 倒数 第 10 个 符号 为 1 的 所 有 字符 串 
构建 一 个 DFA。 你 会 发 现 即 使 构建 这 种 语言 的 NFA 仅仅 需要 10 种 状态 ， 却 无 法 在 512 种 
状态 内 构建 一 个 DFA。 

问 : 如 何 才能 写 出 一 个 正则 表达 式 来 指定 包含 空 字符 串 的 单元 素 集合 ? 

答 : 我 们 使 用 符号 e 来 表示 包含 长 度 为 0 的 字符 串 的 单元 素 集合 。 我 们 还 使 用 8 来 表示 
不 包含 任何 字符 串 的 空 集 。 严 格 来 说 ， 这 些 都 应 该 包含 在 我 们 对 正则 表达 式 的 正式 定义 中 。 

问 : 空 集 的 闭 包 是 什么 ? 

答 : 空 字符 串 : {}^*= €。 


练习 


5.1.1 编写 一 个 解决 回 文 识别 问题 的 Java 程序 ， 从 标准 输入 中 获取 输入 字符 串 序列 。 为 了 简单 起 见 ， 
我 们 假设 符号 集 是 罗马 字母 。 具 体 来 说 ， 对 于 标准 输入 中 的 每 个 字符 串 ， 如 果 字 符 串 是 回 文 ， 
则 程序 打印 这 个 字符 串 且 后 面 接 “is a palindrome”， 如 果 字 符 串 不 是 回 文 ， 程 序 应 该 打印 这 个 
字符 串 且 后 面 接 “is not a palindrome”。 
5.1.2 ”以 练习 5.1.1 的 方式 ,编写 一 个 解决 “具有 相同 数量 的 a 和 了 b” 这 种 语言 识别 问题 的 Java 程序 。 
我 们 假设 标准 输入 上 只 会 有 a 和 b 出 现 。 
5.1.3 证 明 : 前文“ 确定 有 限 状 态 自 动机 ”部 分 的 DFA 能 识别 “b 的 数量 是 3 的 倍数 ”这 种 语言 。 
5.1.4 ”基于 符号 集 {a,b}， 对 于 下 列 正则 表达 式 描述 的 语言 ， 给 出 一 个 简洁 的 文字 描述 : 
BR ad 
c. .^* abbabba.^* Ua a a 
5.1.5 基于 符号 集 fab} ， 对 于 以 下 每 种 语言 ， 给 出 一 个 能 描述 它们 的 正则 表达 式 。 
a. 除 空 字符 串 以 外 所 有 的 字符 串 。 
b. 包 含 至 少 三 个 连续 的 b。 
c. 以 a 开头 且 长 度 为 奇数 或 者 以 b 开头 长 度 为 偶数 。 
d. 没有 连续 的 b。 
e. 除了 bb 和 bbb 以 外 的 所 有 字符 串 。 
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f. 以 相同 的 符号 开头 和 结尾 。 

g. 包含 至 少 两 个 a 和 至 多 一 个 bs 

写 出 一 个 Java 正则 表达 式 ， 这 个 表达 式 能 匹配 所 有 仅 包含 5 个 元 音字 母 (a、e、i、o、u) 并 且 
字母 按照 这 个 顺序 出 现 的 单词 (如 abstemious 和 facetious)。 

为 “July 4, 1776” 这 样 格式 的 日 期 写 一 个 Java 正则 表达 式 ， 这 个 正则 表达 式 要 尽 可 能 的 涵盖 你 
认为 合法 的 日 期 并 且 不 能 包含 其 他 字符 串 。 

为 十 进 制 数 写 一 个 Java 正则 表达 式 。 一 个 十 进 制 数 即 前 面 一 串 数 字 序 列 ， 然 后 跟着 一 个 小 数 
点 ， 后 面 再 跟 一 串 数字 序列 。 在 这 两 个 数字 序列 中 ， 至 少 有 一 个 是 非 空 的 。 如 果 第 一 个 数字 序 
列 有 不 止 一 个 数字 ,那么 这 个 序列 不 能 以 0 开始 。 

在 Java 中 为 (科学 计数 法 的 ) 浮 点 数 写 一 个 Java 正则 表达 式 。 一 个 浮 点 数 以 一 个 十 进 制 数字 为 
开头 ( 见 前 面 的 练习 )， 后面 跟 e 或 者 E 中 的 一 个 ， 再 跟 “+” 或 者 “和 ”其 中 的 一 个 ， 最 后 跟 
一 个 整数 尾数 。 

定义 工 为 语言 {aaaba, aabaa, abbba, ababa, aaaaa}。 挑 选 出 可 以 识别 以 下 语言 的 正则 表达 式 : 
(Ci) 不合 工 中 的 任意 字符 串 ; (ii) 含有 工 中 的 一 些 字符 串 且 含有 一 些 其 他 字符 串 ; 《证 ) 含有 工 
中 的 所 有 字符 串 且 含 有 一 些 其 他 字符 串 ; (iv) 与 工 完 全 相同 。 


a. a(alb)*abb(alb)* b. a(alb)*a 
c. a*b*aba d. a((a*|b*)|(b*aba*))a 
e. a*b*aa*b*ba*a*a*b*b*a*a*b* f. (alb)(alb)(alb)(alb)a 


g. (alaalaaa)(balaalbbb)a 

设计 一 个 可 以 识别 含有 奇数 个 a 和 偶数 个 b 这 种 语言 的 DFA， 然 后 按照 DFA (程序 5.1.3 ) 期 
望 的 格式 创建 一 个 文件 并 测试 你 的 设计 。 

设计 一 个 可 以 识别 社会 安全 号 码 的 DFA， 然 后 按照 DFA (程序 5.1.3 ) 期 望 的 格式 设计 一 个 文 
件 并 测试 你 的 设计 。 

写 一 个 Java 程序 来 解决 被 正则 表达 式 C.{2,4}C...[LIVMFYWCX].{8}H.{3,5}H 描述 的 语言 
识别 问题 。 这 个 程序 不 能 使 用 Java 自 带 的 正则 表达 式 机 制 ， 以 标准 输入 上 用 户 输入 的 一 系列 
字符 串 作 为 程序 的 输入 数据 。 

设计 一 个 可 以 识别 语言 a.*alb.*b 的 DFA， 然后 设计 一 个 可 以 识别 相同 语言 且 拥 有 更 少 状态 的 
NEFA。 

设计 一 个 识别 语言 .*aabab.* 的 DFA (所 有 含有 aabab 的 字符 串 的 集合 )， 然 后 设计 一 个 可 以 识 
别 相同 语言 且 拥 有 更 少 状态 的 NFA。 

考虑 这 么 一 个 自动 售 货 机 ， 对 于 价值 25 美 分 的 货物 ， 它 可 以 接受 $ 美 分 、10 美 分 ， 以 及 25 
美 分 的 硬币 。 设 计 一 个 对 于 每 种 可 能 的 投入 金额 都 有 相应 状态 的 DFA， 并 且 添 加 迁移 使 得 当 
投入 的 金额 总 数 是 i 的 5 倍 时 ， 机 器 处 于 状态 i。 

描述 如 何 将 任意 一 个 DFA 转换 为 可 以 识别 原来 DFA 识别 的 语言 的 补 集 (基于 相同 的 符号 集 ， 
不 包含 在 该 语言 中 的 所 有 字符 串 的 集合 ) 的 DFA。 

将 上 一 题 中 的 DFA 改 为 NFA。 

对 于 “所 有 拥有 奇数 个 a 和 偶数 个 b 的 二 进 制 字符 串 ” 这 种 语言 ， 创 建 一 个 可 以 识别 它 的 DFA。 
将 上 一 题 中 的 DFA 改 为 一 个 正则 表达 式 。 

画 出 对 应 以 下 正则 表达 式 的 NFA: 


a. a(alb)*a b. a*b*aba 
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c. (alb)(alb)a d. a((a*|b*)|(b*aba*))*a 

e. ab(alb)ba | a(alb)aba | aa(ablbalaa)a 

将 “ NFA 识别 举例 ”部 分 给 出 的 NFA (这 个 NFA 能 识别 不 包含 字符 串 bba 的 字符 串 ) 转换 为 
一 个 DFA。 

是 否 有 可 能 构造 一 个 正则 表达 式 来 描述 所 有 拥有 相等 数量 的 ab 和 ba 的 二 进 制 字 符 串 呢 ? 
答案 : 回答 是 肯定 的 ，(a.*a) | (b.*b)| a*|b* 就 是 一 个 例子 。 虽 然 DFA 不 能 够 对 ab 和 ba 进行 计 
数 ， 但 是 在 这 种 情况 下 ， 这 个 语言 与 “所 有 以 相同 位 开始 和 结束 的 二 进 制 字符 串 ” 语 言 相同 ， 
所 以 不 需要 计数 。 


5.1.24 ”证 明 没 有 DFA 可 以 识别 所 有 回 文 的 集合 。 

5.1.25 证 明 以 下 是 正则 语言 : 不 包含 字符 串 bba 并 且 b 的 数量 是 3 的 倍数 。 761 
创新 练习 

5.1.26 ”正则 表达 式 挑战 。 下 列 每 一 个 语言 都 是 基于 符号 集 {0,1} 的 二 进 制 字符 串 ， 请 你 为 这 些 语言 分 
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别 构建 一 个 正则 表达 式 。 

a. 除 了 11 和 111 之 外 的 所 有 二 进 制 字符 串 。 

b. 每 个 奇数 位 位 置 都 是 1 的 二 进 制 字符 串 。 

c. 至 少 有 两 个 0 且 至 多 有 一 个 工 的 二 进 制 字符 串 。 

d. 没有 两 个 连续 的 1 的 二 进 制 字符 串 。 

二 进 制 数 的 整除 。 对 于 下 列 每 个 选项 ， 构 建 一 个 正则 表达 式 以 描述 二 进 制 字符 串 ， 当 这 些 二 
进 制 字符 串 被 当 作 整数 来 看 时 ， 可 以 使 得 选项 描述 的 条 件 成 立 。 

a. 可 以 被 2 整除 。 b. 可 以 被 3 整除 。 c. 可 以 被 6 整除 。 

正则 表达 式 搜 索 。 检 查 你 的 计算 机 上 的 各 种 程序 (网 页 浏览 器 、 文 字 处 理 器 、 音 乐 库 或 者 其 他 
常用 的 软件 )， 并 确定 它们 的 搜索 功能 是 否 支持 正则 表达 式 ， 以 及 能 支持 到 什么 程度 。 

可 以 被 3 整除 (二进制 )。 设 计 一 个 DFA， 这 个 DFA 可 以 识别 的 语言 为 所 有 可 以 被 3 整除 的 数 
字 转 换 成 的 二 进 制 字符 串 。 例 如 ，1111 表示 的 是 十 进 制 15， 所 以 可 以 被 接受 ; 但 是 1110 会 被 
拒绝 。 提 示 : 使 用 三 种 状态 ， 你 的 DFA 需要 根据 输入 数字 除 以 3 得 到 的 余数 的 不 同 来 确定 它 
应 该 处 于 三 种 状态 中 的 哪 一 种 。 

弹跳 过 滤 。 有 限 状态 转换 器 (finite state transducer) 也 是 一 种 DFA， 只 是 它 的 输出 是 一 个 符号 
序列 。 它 大 致 与 DFA 相同 ， 只 是 它 的 每 个 迁移 都 标 有 一 个 输出 符号 ， 每 当 进 行 迁移 的 时 候 都 
会 输出 这 个 符号 。 开 发 一 个 转换 器 用 来 移 除 输 入 中 孤立 的 符号 。 具 体 来 说 ,输入 中 出 现 的 任 
何 aaba 都 应 该 在 输出 中 被 aaaa 取代 ， 输 入 中 出 现 的 任何 bbab 都 应 该 在 输出 中 被 bbbb 取代 ， 
否则 输入 和 输出 应 该 保持 不 变 。 762 
采集 器 。 一 个 Java 的 Pattern 对 象 代表 了 一 个 正则 表达 式 。 这 样 的 一 个 对 象 可 以 用 来 为 一 
个 给 定 的 字符 串 构 建 Matcher 对 象 。Matcher 对 象 可 以 表示 一 个 与 这 个 正则 表达 式 相 对 应 的 
NFA。Matcher 对 象 包括 的 操作 有 find()， 它 用 于 寻找 字符 串 中 下 一 个 与 正则 表达 式 匹 配 的 项 ; 
group()， 它 用 于 返回 能 导致 这 种 匹配 的 字符 串 字符 。 编 写 一 个 Pattern 和 Matcher 的 客户 程序 ， 
客户 程序 将 一 个 文件 名 (或 者 一 个 URL) 和 一 个 正则 表达 式 作 为 命令 行 输入 ,并 且 输 出 文件 中 
所 有 与 正则 表达 式 匹 配 的 子 字符 串 。 
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答案 : 


import java.util.regex.Pattern; 
import java.util.regex.Matcher; 
public class Harvester 
public static void main(String[] args) 
{ 
In in = new In(args[1]); 
String re = args[0]; 
String input = in.readA110) ; 
Pattern pattern = Pattern.compile(re); 
Matcher matcher = pattern.matcher(input); 
while (matcher.find()) 
System.out.printlnCmatcher .group()) ; 
下 
} 


计数 匹配 。 开 发 一 个 程序 ， 这 个 程序 可 以 对 标准 输入 中 与 命令 行 上 的 正则 表达 式 相 匹 配 的 子 
字符 串 进行 计数 ， 生 不 用 担心 重复 匹配 (使 用 前 面 练 习 中 编写 的 Pattern 和 Matcher)。 
网 络 爬 贝 。 修 改 练习 5.1.31 的 解决 方案 来 开发 一 个 程序 ， 这 个 程序 可 以 打印 出 作为 命令 行 参 
数 的 网 页 所 能 访问 的 所 有 网 页 。 
一 级 正则 表达 式 。 构 建 一 个 Java 正则 表达 式 ， 这 个 表达 式 可 以 指定 符合 二 进 制 正 则 表达 式 的 字 
符 串 集 合 ， 但 不 会 出 现 峙 套 的 括号 。 例 如 (a.*b)*|(b.*a)* 在 语言 中 ， 而 (b(alb)b)* 不 在 语言 中 。 
查找 和 替换 。 编 写 一 个 过 滤器 SearchAndReplace.java， 这 个 过 滤器 可 以 将 一 个 正则 表达 式 和 
一 个 字符 串 str 作为 命令 行 参数 ， 从 标准 输入 中 读 取 一 个 字符 串 ， 将 标准 输入 中 的 所 有 与 正则 
表达 式 匹 配 的 子 字 符 串 替换 为 sr， 然 后 将 结果 发 送 到 标准 输出 。 首 先 使 用 Java 的 String 库 中 
的 replaceAll( 方法 实现 这 个 功能 ， 然 后 不 使 用 这 个 方法 再 给 出 一 个 解决 方案 。 
空 语言 测试 。 在 DFA 中 加 入 一 个 isEmpty( 方法 (程序 5.1.3 )， 如 果 这 个 自动 机 能 够 识别 的 语 
言 为 空 ， 那 么 返回 true， 否 则 返回 false。 
答案 : 这 段 代码 使 用 了 “广度 优先 搜索 ”和 一 个 Queue 来 跟踪 从 状态 0 可 以 到 达 的 状态 ( 见 
程序 4.5.4 )。 
public boolean isEmpty() 
和 
Queue<Integer> queue = new Queue<Integer>() ; 
boolean[] reachable = new boolean[n]; 
queue.enqueue(0); 
while (!queue.isEmpty©O) 
{ 
int state = queue.dequeue(); 
if (action[state] .equals("Yes")) return false; 
reachable[state] = true; 
for (int 1 = 0; i < alphabet.length(); i++) 
{ 
int st = next[state].get(alphabet.charAt(i)); 
if (!reachable[st]) queue.enqueue(st); 
} 
} 


return true; 


} 


为 语言 设置 操作 。 给 定 可 以 识别 两 种 语言 A 和 B 的 NFA， 思 考 一 下 如 何 构 造 可 以 识别 A 和 B 
的 并 集 和 交集 的 NFA。 
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5.1.38 ”随机 输入 。 对 于 一 个 给 定 的 DFA， 编 写 程序 来 估算 它 能 识别 一 个 随机 生成 的 长 度 为 n 的 二 进 
制 字符 串 的 可 能 性 。 

5.1.39 NEFA 到 DFA 的 转换 。 编 写 一 个 程序 ， 这 个 程序 可 以 从 一 个 NEFA 中 读 取 它 的 描述 ， 并 创建 一 
个 能 与 这 个 NFA 识别 相同 语言 的 DFA。 

5.1.40 最 小 的 语言 。 给 定 一 个 正则 语言 L， 证 明 世 中 最 小 字符 串 的 集合 也 是 正则 的 。 最 小 字符 串 的 
意思 是 ， 如 果 字 符 串 x 在 工 中 , 那么 对 于 任何 一 个 字符 串 xy (y 为 任 一 非 空 字符 串 ) 一 定 不 在 
正中 
答案 : 对 DFA 进行 修改 ， 使 得 一 旦 它 离 开 接受 状态 ,就 总 是 处 于 拒绝 状态 。 

5.1.41 反 向 引用 。 证 明 反 向 引用 操作 是 一 个 “不 那么 正则 ”的 表达 式 ， 因 而 不 能 以 核心 正则 表达 式 操 
作 来 构造 。 证 明 没有 DFA 可 以 识别 ww 形式 的 语言 ， 其 中 w 是 任意 字符 串 (例如 beriberi 和 
couscous), 但 是 Java 正则 表达 式 “(.*)\1” 可 以 描述 这 种 语言 。 

5.1.42 通用 虚拟 NFA。 开 发 一 个 类 似 程序 5.1.3 的 程序 ， 这 个 程序 可 以 模拟 任何 NFA 的 操作 s 像 练 
习 5.1.36 那样 ,使 用 一 个 NFA 的 图 形 表示 和 一 个 跟踪 它 可 能 状态 集合 的 Queue 来 实现 本 文中 
描述 的 方法 。 对 程序 进行 测试 , 令 程 序 在 读 取 每 个 符号 之 前 打印 NFA 所 有 可 能 状态 的 集合 。 
测试 你 的 代码 ， 其 中 NFA 可 以 识别 所 有 倒数 第 四 个 符号 是 一 个 1 的 字符 串 组 成 的 集合 ， 输 入 
数据 是 aaaaababaabbbaababbbb。 

5.1.43 通用 虚拟 PDA。 一 个 下 推 自动 机 与 DFA 相 比 增加 了 一 个 堆栈 ， 以 及 在 任何 迁移 时 将 符号 压 信 
栈 中 或 从 栈 中 弹出 符号 的 能 力 。 具 体 来 说 ， 每 个 迁移 都 有 一 个 额外 的 标签 ， 如 果 标 签 是 “x/ 
y”， 则 弹出 堆栈 ， 并 且 当 弹出 符号 是 x 时 压 人 y; 如 果 标 签 是 “/y”， 则 表示 仅仅 将 y 压 人 而 
不 弹出 任何 符号 ; 如 果 标 签 是 “/x”， 则 意味 着 弹出 堆栈 ， 并且 当 弹出 符号 是 x 时 不 压 人 任何 
符号 ; 如 果 标 签 是 “/” 则 意味 着 仅仅 弹出 堆栈 。 开 发 二 个 类 似 于 程序 5.1.3 且 可 以 模拟 任何 
PDA 操作 的 程序 。 

5.1.44 非 正 则 语言 的 PDA。 画 出 一 个 可 以 识别 有 相等 数量 的 a 和 bb 语言 的 PDA ( 见 之 前 的 练习 )， 并 
且 用 前 面 练习 的 解决 方案 来 测试 它 。 


5.2 图 灵机 


艾 伦 . 图 灵 在 1937 年 发 表 的 论文 中 介绍 了 20 世纪 最 美丽 而 有 趣 的 知识 发 现 之 一 ， 这 是 
一 个 简单 的 计算 模型 ， 它 足以 体现 任何 计算 机 程序 的 特征 ， 并 且 构 成 了 计算 机 理论 的 基础 。 
因为 它 的 描述 和 行为 都 很 简单 ， 所 有 我 们 可 以 很 容易 地 对 它 进行 数学 分 析 。 这 个 分 析 让 图 灵 
对 计算 机 和 计算 有 了 更 深入 的 理解 : 所 有 已 知 的 计算 设备 从 深层 次 的 技术 原理 层面 来 说 都 是 
等 价 的 ， 而 且 有 一 些 计算 问题 无 论处 理 器 有 多 快 或 者 有 和 多少 可 用 的 内 存 ， 都 是 根本 无 法 解决 
的 。 我 们 会 在 接 下 来 的 两 节 中 讨论 这 些 想法 ， 作 为 基础 ， 我 们 首先 需要 分 析 图 灵 的 发 明 到 底 
是 什么 ， 以 及 它 的 概念 和 基本 属性 是 什么 。 

如 果 你 在 其 他 地 方 曾经 阅读 过 有 关 图 灵机 的 资料 ， 或 者 将 来 在 其 他 材料 中 遇 到 图 灵机 ， 
你 会 发 现 它 的 定义 和 某 些 属性 与 我 们 给 出 的 略 有 不 同 。 事 实 上 这 种 差距 是 无 关 紧 要 的 ， 这 个 
理论 中 关键 的 一 点 就 是 ,我们 创造 的 任何 计算 模型 都 可 以 变形 为 与 之 等 价 的 复杂 模型 。 我 们 
使 用 的 方法 是 根据 20 世纪 中 叶 麻 省 理工 学 院 的 马 文 ， 明 斯 基 开 发 的 一 个 模型 改编 的 。 

图 灵机 模型 ”我 们 研究 的 目标 是 一 个 抽象 的 机 器 模型 ， 它 比 前 一 部 分 所 提 到 的 DFA 模 
型 要 稍微 复杂 一 些 ， 这 个 模型 被 称 为 图 灵机 (Turing Machine，TM)。 在 下 面 的 描述 中 ， 我 
们 会 将 它 与 图 灵机 的 区 别 用 厅 色 明显 地 标识 出 来 。 每 个 TM 由 以 下 部 分 组 成 : 
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。 有限 数量 的 状态 ， 每 个 状态 都 被 设 定 成 左 闫 态 、 太 状态 、 亨 个 状态 、 接 受 状态 和 拒绝 
状态 中 的 一 个 。 
。 一 组 用 于 指定 下 一 个 状态 以 及 要 写 入 万 个 偿 号 的 迁移 。 每 个 状态 对 于 符号 表 中 的 每 个 
符号 都 有 一 个 迁移 。 

。 一 个 存 有 符号 字符 串 的 纸 带 。 

。 一 个 能 够 读 或 写 一 个 符号 并 且 能 够 向 左 或 向 右 移 动 来 读 取 下 一 个 符号 的 纸 带 头 。 

一 个 TM 操作 从 状态 0 开始， 而且 此 时 纸 带 头 的 位 置 在 输入 符号 的 第 一 个 (最 左 侧 )， 
然后 读 取 即 写 入 纸 带 并 根据 以 下 规则 按照 步 又 改变 状态 : 

。 读 一 个 符号 。 

。 寻找 与 这 个 符号 以 及 当前 状态 相关 的 迁移 。 

。 写 入 由 这 个 迁移 指定 的 符号 。 

。 戊 葡 次 态 为 总 个 迁移 衣 定 的 次 访 。 

。 如 黑 冯 个 新 次 态 故 一 个 石 次 态 ， 将 纸 带 头 向 右 移 一 个 位 置 。 

。 如 扣 这 个 新 凑 态 起 一 个 堪 凑 态 ， 将 纸 浓 头 向 左 殉 一 个 位 置 。 

。 如 扣 新 次 态 古 罚 停 、 楼 受 或 起 纺 凑 态 中 的 一 个 ， 操 作 停止 。 

。 将 对 应 于 最 终 状 态 的 灯 点 亮 。 

我 们 将 每 个 TM 表示 为 一 个 图 ， 图 中 接受 、 拒 绝 、 莉 和 售 、 左 和 右 状 态 分 别 是 标记 为 
Yes、No、 信 、L 和 尺 的 顶点 ， 每 个 迁移 是 一 条 被 符号 表 中 一 邓 符 号 标记 的 有 向 边 。 

下 图 展示 了 一 个 基于 二 进 制 符 号 表 的 TM。 与 DFA 一 样 ， 我 们 从 0 开始 用 整数 对 顶点 
进行 编号 。 每 个 迁移 都 标 有 一 对 用 冒号 分 隔 的 符号 。 第 一 个 符号 标记 的 是 迁移 时 读 取 的 符 
号 ; 第 二 个 符号 标记 迁移 时 写 和 的 符号 。 





为 了 减少 混乱 ， 我 们 通常 使 用 一 个 简略 的 版 本 ， 在 这 个 版 本 中 我 们 没有 画 出 盒子 、 指 示 
灯 还 有 纸 带 并 且 隐 去 了 以 下 内 容 〈 即 图 中 不 再 画 出 ): 

。 不 会 对 纸 带 进行 改变 的 自 循 环 。 

。 如 果 一 个 状态 迁移 不 会 改变 纸 带 》 隐 去 其 标签 上 的 冒号 和 冒号 后 的 第 二 个 符号 。 

对 任意 的 输入 符号 ， 如 果 它 带 来 的 状态 转变 没有 更 改 纸 带 ， 我 们 将 使 用 无 标记 的 单 箭头 
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来 表示 这 个 状态 迁移 。 

我 们 将 左右 状态 称 为 打 描 状态 ( scanning state) 一 一 机 器 会 扫描 并 掠 过 触发 隐 式 转换 的 
符号 ( 读 取 然后 写 入 相同 的 符号 )， 直 到 读 到 要 求 转换 到 男 一 状态 的 符号 。 例 如 在 上 面 描绘 
的 机 器 中 ， 状 态 0 向 右 扫 描 直 到 遇 到 了 输入 中 的 一 个 # 符 号 。 缩 略 版 可 能 会 给 你 带 来 一 些 疑 
惑 ， 但 是 它 可 以 让 机 器 变 得 更 容易 理解 ， 在 我 们 对 它们 进行 更 详细 的 研究 时 这 个 特征 会 变 得 
更 明显 。 

TM 模型 和 DFA 模型 之 间 的 差异 看 起 来 很 小 ， 但 是 正如 你 将 会 看 到 的 ， 它 们 具有 很 深 
远 的 意义 。 即 使 是 仅仅 只 有 几 个 状态 的 机 器 ， 它 的 行为 也 可 能 是 非常 复杂 的 。 在 我 们 开始 之 
前 ， 你 有 两 个 需要 注意 的 地 方 。 首 先 ， 纸 带头 何 时 向 左右 移动 是 没有 限制 的 。 这 意味 着 纸 带 
是 无 限 的 一 一 往 纸 带 的 左 侧 或 右 侧 读 取 或 写 入 多 少 个 纸 带 单元 都 是 没有 限制 的 。 我 们 使 用 # 
这 个 元 符号 来 表示 那些 尚未 达到 的 纸 带 单元 的 内 容 ， 并 且 想 象 成 这 个 纸 带 可 以 提供 取 之 不 尽 
的 纸 带 单元 ， 所 以 无 论 何 时 机 器 到 达 一 个 新 的 地 方 ， 都 有 一 个 符号 为 # 的 单元 存在 。 其 次 ， 
图 灵机 的 状态 迁移 次 数 是 没有 限制 的 。 这 两 种 情况 有 一 个 最 简单 的 例子 ， 存 在 这 么 一 个 图 灵 
机 ， 它 只 包含 一 个 右 状 态 ， 且 这 个 状态 只 有 一 个 隐 式 转换 ， 如 左 图 所 示 。 这 人 台 机 器 简单 地 向 


下 右 移动 ， 无 限 的 要 求 读 取 越 来 越 多 的 纸 带 单元 。 最 开始 这 看 起 来 像 是 
R 一 个 人 造 的 例子 ， 但 是 它 和 一 个 对 标准 输入 进行 循环 读 取 的 Java 程序 
ene 几乎 没有 区 别 ， 因 为 我 们 都 是 假设 Java 程序 可 以 从 标准 输入 读 取 无 穷 
while (!StdIn,isEmpty()) 无 尽 的 数据 。 
StdIn. readcharO; 接 下 来 我 们 会 对 一 些 图 灵机 进行 实验 ， 这 些 图 灵机 可 以 完成 有 趣 
NT 且 有 用 的 计算 任务 。 


二 进 制 增 量 。 那 么 我 们 要 介绍 的 第 一 个 图 灵机 的 例子 进行 了 什么 样 的 计算 呢 ? 这 是 一 个 
二 进 制 增 量 计算 : 如 果 输 入 是 一 个 二 进 制 数字 ， 那 么 这 个 数字 会 增加 。 如 果 你 对 二 进 制 的 算 
术 运 算 不 熟悉 的 话 ， 你 可 以 现在 就 阅读 6.1 节 ， 尽 管 这 个 计算 很 简单 上 且 很 熟悉 ， 你 可 能 不 需 
要 这 么 做 。 考 虑 将 二 进 制 数 10111 (十 进 制 为 23 ) 加 1 然后 得 到 结果 11000 (十 进 制 为 24 ) 
的 过 程 。 其 实 这 个 计算 的 原理 你 已 经 学 过 ， 只 是 你 在 学 校 学 到 的 是 999 加 上 1 之 后 会 得 到 
1000。 为 了 简单 解释 这 个 过 程 ， 你 可 以 这 么 说 ; 从 志向 去 束 ， 将 过 到 的 1 都 变 成 0 直到 你 
遇 到 了 一 个 0， 然 后 将 这 个 0 变 为 1。 正如 下 面 我 们 展示 的 详细 跟踪 一 样 ， 我 们 的 TM 实现 
了 这 个 过 程 。 从 状态 0 开始， 机 器 在 所 有 的 输入 符号 上 向 右 扫描 直到 它 遇 到 了 输入 的 右 侧 的 
第 一 个 #， 此 时 它 开始 向 左 移动 并 进入 状态 1。 处 于 状态 1 时 ， 只 要 读数 为 1， 则 向 左 扫描 
并 将 每 个 1 改 为 0。 当 它 到 达 一 个 0 时 ， 将 0 转换 为 1 并 进行 转换 至 暂停 状态 。 在 这 个 从 右 
至 左 的 扫描 中 ， 如 果 在 遇 到 0 之 前 先 遇 到 一 个 #， 那 么 输入 就 全 部 是 1 并 且 已 经 全 部 变 成 0 
了 ， 所 以 机 器 需要 改变 
输入 是 无 限 的 ， 所 以 仍然 有 一 个 # 在 开头 处 ) 。 我 们 的 例子 也 说 明了 即使 输入 拥有 前 导 0 时 ， 
机 器 也 能 正常 工作 。 

紧凑 的 跟踪 格式 。 与 其 将 整个 TM 的 每 一 步 都 画 出 来 ， 我 们 这 里 使 用 一 种 更 为 紧凑 的 跟 
踪 格 式 来 展示 上 面 的 过 程 。 我 们 对 当前 状态 、 纸 带头 和 纸 带 内 容 进 行 跟踪 ， 将 要 写 在 纸 带 上 
的 符号 标 成 蓝 色 (图 中 的 颜色 和 正文 文字 要 对 应 )。 在 每 一 行 中 ， 我 们 都 会 标识 出 在 每 一 个 
状态 下 纸 带 内 容 和 纸 带 头 位 置 发 生 的 变化 ， 并 对 应 状态 变化 移动 到 新 的 一 行 。 在 每 一 行 上 ， 
纸 带头 都 会 停 在 导致 状态 变化 的 符号 的 位 置 (这 个 符号 可 能 会 被 改写 )。 
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向 右 扫描 # 向 左 扫 描 到 0， 将 1 全 部 改变 为 0 





























状态 磁带 说 明 
Yo 轩 04.0.1 ;1 二 类 二 开 始 
" 而 o> 全 0 #0..0 .1.1, 1 因 - 向 右 扫描 到 # 
#:17 1 # TD 回 o 0 0 当 ” 向 左 扫描 到 0， 翻转 每 一 位 
天 和 IT 000-0 -到 委 人 引 
一 个 二 进 制 增 量 TM 的 紧凑 跟踪 
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相关 机 器 。 我 们 的 二 进 制 增 量 TM 有 一 个 显著 的 特点 是 它 可 以 用 于 任意 长 度 的 整数 。 如 
果 你 的 纸 带 上 有 一 个 十 亿 位 的 三 进 制 整数 ， 它 也 会 增加 它 〈 如 果 十 亿 位 都 是 1， 那 么 它 会 令 


十 亿 零 一 位 变 成 1 )。 实 际 上 ， 我 们 可 以 用 这 么 简单 的 机 器 来 计 
算 这 么 大 的 数字 是 一 件 非常 了 不 起 的 事情 。 男 外 ， 如 果 我 们 将 
进入 停止 状态 的 # 迁移 的 标签 从 # : 1 改 成 # : #， 将 得 到 一 个 
固定 长 度 的 二 进 制 增 量 器 ， 它 不 会 改变 数字 的 长 度 ， 但 是 它 会 
将 溢出 忽略 (就 像 许 多 计算 机 做 的 一 样 )。 男 一 个 变化 思路 是 一 
个 固定 长 度 的 二 进 制 递减 器 ( fixed-length binary decrementer)， 
除了 将 机 器 中 0 和 1 的 角色 互 换 之 外 ， 这 两 个 机 器 是 相同 的 : 
从 右 向 左 移动 ， 将 遇 到 的 0 改变 成 1 直到 遇 到 一 个 1， 然 后 将 1 
改变 为 0。 这 个 规则 在 除了 这 个 数字 全 部 是 0 的 情况 下 是 有 效 
的 。 当 数字 全 是 0 时 ， 数 字 将 全 部 变 成 1 (一 个 二 进 制 递减 函数 
是 一 个 必须 去 除 前 导 0 的 递增 函数 的 反 函 数 ， 见 练习 5.2.10 )。 
请 注意 ， 这 三 台 图 灵机 除了 离开 状态 1 的 迁移 有 一 点 区 别 之 外 ， 
其 他 都 是 一 样 的 。 

你 需要 通过 练习 写 出 不 同 输入 下 的 机 器 跟踪 轨迹 ， 以 测试 
你 对 TM 的 基本 特性 以 及 跟踪 格式 的 理解 。 这 会 是 一 个 对 你 很 
有 帮助 的 过 程 。 

状态 表格 表示 。 请 特别 注意 ， 图 灵机 和 DFA 一样， 我 们 可 
以 很 容易 地 将 一 个 图 灵机 描述 为 一 张 表 。 表 中 的 一 行 代表 一 个 
状态 ， 对 于 每 个 输入 符号 ， 这 一 行 显示 这 个 状态 是 右 、 左 、 接 
受 、 拒 绝 还 是 暂停 ， 并 给 出 下 一 个 状态 和 将 要 改写 的 符号 。 对 
于 我 们 上 面 介绍 过 的 二 进 制 增 量 器 TM， 我 们 在 右 侧 给 出 了 它 
的 一 个 表格 表示 。 当 然 ， 隐 式 状 态 迁 移 也 会 在 这 个 表 中 明确 地 
表示 出 来 。 
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状态 动作 0 工交 
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状态 表格 表示 





二 进 制 加 法 器 。 下 图 展示 的 TM 是 一 个 加 法 器 : 它 将 纸 带 中 输入 的 atb 替换 为 a 和 上 b 的 
总 和 (a、b 和 它们 的 和 都 是 用 二 进 制 表 示 的 正 整数 )。 例 如 ， 如 果 机 器 启动 时 纸 带 里 的 内 容 
是 “#1011+1010#”， 它 会 计算 1lio + 101o = 21io 并 且 在 机 器 停止 时 将 “#10101#” 写 在 纸 带 
上 。 与 我 们 的 二 进 制 增 量 器 相同 ， 数 字 的 大 小 是 任意 的 一 一 无 论 输 入 的 数字 有 和 多少 位 ，TM 
都 会 计算 它 的 总 和 。 完 成 计算 的 策略 如 下 ， 递 增 a 的 同时 递减 b， 循 环 操 作 直 到 b 变 成 0。 


机 器 通过 6 个 状态 来 完成 工作 : 
。 状态 0 直接 向 右 扫描 数据 至 最 右 端 。 
。 状态 1 对 加 号 右 侧 的 数字 进行 递减 操作 。 
。 状态 2 向 左 扫描 至 加 号 左 侧 数字 的 最 右 端 。 
。 状态 3 对 加 号 左 侧 的 数字 进行 递增 操作 。 


。 递减 到 0 时 ， 机 器 会 达到 状态 4 一 一 递减 操作 将 所 有 的 0 都 变 成 了 1， 并 且 在 查找 0 
的 时 候 找 到 了 “+”。 此 时 “+” 左 边 的 数字 是 “ a+b”， 所 以 剩 下 需要 做 的 事 就 是 将 


“ 半 ” 以 及 “4” 右边 的 1 全 部 变 成 #。 
。 状态 5 是 停止 状态 。 
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向 右 查 找 # 
向 左 查 找 + 
递增 
清理 
停止 


下 面 给 出 了 一 个 跟踪 的 简单 示例 。 经 过 对 这 个 跟踪 的 学 习 ， 你 会 发 现 机 器 可 以 将 任何 两 
个 给 定 的 二 进 制 数字 相 加 。 而 且 ， 这 人 台 机 器 可 以 计算 任意 长 度 的 一 进 制 数字 。 二 个 这 人 么 简单 


的 机 器 可 以 执行 这 样 的 计算 是 很 神奇 的 。 
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效率 。 在 本 节 和 下 一 节 中 , 我们 把 关注 点 仅 放 在 探索 那些 可 以 用 TM 模型 来 实现 的 计算 
上 ; 我 们 对 执行 这 些 计算 的 速度 并 不 感 兴趣 ， 这 是 在 5.5 节 重 点 讨论 的 问题 。 这 样 一 来 ,你 
可 能 已 经 想 知 道 一 个 这 么 慢 的 机 器 是 否 有 存在 的 必要 。 在 计算 总 和 时 ， 人 们 总 是 首先 考虑 字 
段 长 度 ， 而 不 是 它们 的 规格 ， 我 们 甚至 可 以 建立 一 个 二 次 时 间 的 TM 来 完成 这 个 工作 ( 见 练 


习 5.2.22 )， 只 是 这 些 与 我 们 现在 的 讨论 无 关 。 


二 进 制 字 符 中 字符 频率 相等 问题 的 求解 。 我 们 的 下 一 个 例子 是 一 个 已 经 被 证 明 不 可 能 
由 DFA 实现 的 计算 : 给 定 一 个 二 进 制 字符 串 作 为 输入 ， 判 断 其 中 两 个 字符 出 现 的 次 数 是 
否 相 等 。 例 如 ， 对 于 aabaabbbab 和 aaabbb 这 样 的 字符 串 ， 我 们 的 机 器 进入 Yes 状态 ， 对 
于 aaa 和 aabbbab 这 样 的 字符 串 ， 我 们 的 机 器 进入 No 状态 。 这 里 展示 的 TM 会 执行 这 个 


计算 。 








下 二 个 状态 ， 写 和 ; 

动作 .a..b.#， ab.# # 一 
0 L 001 ab# 向 赤 查找 # i ep 
1 R 234 XX# ”测试 第 = 个 符号 RZ 3 
2 R210 5 .1 可 X 关 闵 向 有 查找 B - 攻 ， 一 + 一 全 
3 R 036 Xb# 二 向 右 查 找 a 
Aity 接受 a:X b:X 
Su 拒绝 人 洒 
谷 烈 拒绝 ”@ 





判断 二 进 制 字符 频率 相等 的 TM 


如 果 你 想 要 理解 机 器 是 如 何 工作 的 ， 请 先 研究 下 边 给 出 的 跟踪 轨迹 。 它 先 找到 最 左边 的 
符号 (a 或 b)， 然 后 用 又 覆盖 这 个 符号 ， 接 着 查找 另 一 个 符号 〈b 或 a)。 如 果 找 不 到 匹配 的 字 
符 ， 那么 机 器 进入 No 状态 。 若 找到 了 匹配 的 符号 ， 机 器 会 用 X 覆盖 。 然 后 机 器 接着 返回 输入 
的 最 左 端 并 查找 下 一 个 匹配 的 字符 对 。 每 当 机 器 进入 状态 0 时 ， 我 们 知道 机 器 已 经 用 X 覆 写 
了 相等 数量 的 a 和 b， 所 以 如 果 在 状态 1 时 扫描 没有 找到 a 或 者 b 符 号 ,那么 证 明 原始 字符 串 
具有 相同 数量 的 a 和 b， 这 个 字符 串 被 接受 。 与 Java 程序 一 样 ， 我 们 没有 提供 完整 的 证 明 ， 所 
以 如 果 你 的 研究 方向 偏向 于 数学 ， 你 可 以 想象 一 下 如 何 为 一 个 图 灵机 提供 一 个 理论 上 的 证 明 。 


状态 磁带 说 明 
#iaviasb:b ba bb ##- “开始 
0o -上 园 aab bbab# 向 左 扫描 至 # 
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0 国 X a Xx b b a b # 向 左 扫描 至 # 
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2 YX Sx lb a b. #7 
0 [到 xx Xx X b a b # 向 左 扫描 至 # 
1 #X XX Xx a b # 测试 第 一 个 符号 
Sud “四 > b # 向 右 扫描 至 a 
0 "XX:X Xx XxX X b # 向 左 扫描 至 # 
1 # XX XX X X[ 双 ]# 测试 第 -个 符号 
# X X X X X X X [说 ”在 状态 6 时 拒绝 
等 价 判定 轨迹 


你 可 以 在 本 节 末 尾 的 练习 中 找到 许多 其 他 类 型 的 图 灵机 ， 在 本 章 的 后 面 我 们 也 会 遇 到 很 
多 其 他 的 例子 。 我 们 设计 出 的 图 灵机 ， 可 以 用 来 进行 各 种 计算 ， 宫 括 了 从 乘法 、 除 法 ， 到 一 
元 -二 元 的 换算 ， 再 到 龙 形 曲线 的 函数 式 。 设 计 一 个 图 灵机 就 像 编 写 一 个 Java 程序 ， 是 一 个 
有 趣 且 令 人 满意 的 智力 体验 。 我 们 之 所 以 列举 这 人 么 多 例子 和 练习 ， 目 的 是 为 了 让 你 相信 ， 任 何 
你 能 想象 到 的 计算 都 可 以 用 一 个 图 灵机 来 实现 。 这 就 是 图 灵 在 1937 年 的 论文 中 的 重大 发 现 。 

与 DFA 一 样 ， 如 果 你 没有 用 于 调试 和 跟踪 的 TM 编程 环境 ， 那 么 你 肯定 无 法 深入 了 解 
我 们 练习 中 复杂 TM 的 设计 和 开发 。 或 许 正 如 你 预料 的 一 样 ， 创 建 一 个 可 以 模拟 任何 TM 的 
Java 程序 并 不 是 一 件 困难 的 事情 。 我 们 会 使 用 这 样 一 个 Java 程序 来 测试 本 书 中 的 TM， 并 
产生 对 这 些 TM 的 跟踪 轨迹 。 接 下 来 ， 我 们 研究 这 个 程序 。 

通用 虚拟 图 灵机 ”在 程序 5.1.3 中 ， 我 们 给 出 了 一 个 Java 程序 ， 你 可 以 通过 这 个 Java 
程序 模拟 各 种 DFA 的 操作 ， 生 成 它们 在 各 种 输入 下 的 轨迹 来 研究 DFA 的 属性 。 现 在 我 们 来 
对 图 灵机 做 相同 的 事 。 
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纸 带 。 第 一 个 挑战 是 纸 带 。 我 们 如 何 模拟 一 个 长 度 为 无 限 大 的 纸 带 ? 你 自己 可 能 要 花 
很 长 时 间 来 思考 这 个 问题 ， 但 是 其 实 答案 十 分 简单 : 将 当前 的 字符 保存 在 一 个 char 型 变量 
current 中 ， 然 后 使 用 两 个 下 推 栈 ， 一 个 用 于 纸 带头 的 左 端 (就 好 像 字符 在 被 从 左 往 右 推 人 
栈 )， 男 一 个 用 于 纸 带头 的 右 端 (就 好 像 字 符 在 被 从 右 往 左 推 信 栈 )。 一 旦 建立 起 这 个 表示 形 
式 ， 我们 就 能 很 容易 地 看 到 解决 这 个 问题 的 方法 。 例 如 下 图 所 示 ， 如 果 纸 带头 不 在 输入 最 左 
端的 位 置 ， 我 们 可 以 通过 某 种 方法 将 纸 带 头 向 左 移动 。 这 个 方法 是 将 变量 current 压 人 右 堆 
栈 ， 然 后 将 左 堆 栈 推出 给 变量 current。 如 果 纸 带头 位 于 输入 的 最 左 端 ， 我 们 只 需要 将 一 个 # 
压 入 到 右 栈 上 ， 就 如 下 图 的 左上 方 所 示 。 向 右 移动 的 两 个 例子 相似 ， 如 下 图 的 右边 所 示 。 鉴 
于 这 种 设计 ,我 们 在 程序 5.2.1 中 很 简单 地 实现 了 它 。 这 段 代 码 是 对 于 无 限 长 度 纸 带 的 一 个 
很 好 的 表达 : 每 当 客户 程序 要 求 移动 到 目前 为 止 所 看 到 的 所 有 数据 的 最 左 或 最 右 端 时 ， 我 们 
简单 地 制造 一 个 # 符号 让 客户 程序 产生 纸 带 的 长 度 是 无 限 的 幻觉 。 实 际 上 纸 带 并 不 是 无 限 长 
的 ,， 但 是 从 客户 程序 的 角度 上 来 看 ， 纸 带 的 长 度 没 有 限制 。 当 然 ， 栈 也 具有 相同 的 属性 ， 所 
以 它 在 模拟 无 限 长 度 的 纸 带 时 十 分 有 用 。 
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机 器 。TuringMachine (程序 5.2.2 ) 是 一 个 Tape 类 的 客户 程序 ， 它 实现 了 一 个 通用 虚拟 
TM， 这 个 TM 可 以 模仿 任何 TM 的 操作 。 与 程序 5.1.3 中 的 DFA 一 样 ， 它 从 标准 输入 中 提 
取 一 个 TM 的 规范 (一 个 由 命令 行 参 数 指定 名 称 的 文件 ) 和 一 个 字符 串 序列 ， 然 后 以 给 定 字 
符 串 运行 TM， 并 将 结果 打印 出 来 。 
TM 的 文件 输入 格式 首先 是 状态 的 数量 ， 其 次 是 字母 表 ， 然 后 对 于 每 个 状态 后 都 有 一 行 
信息 。 每 一 行 中 都 包含 一 个 字符 串 ， 这 个 字符 串 是 工 ,RH、Yes 和 No 其 中 的 一 个 。 每 个 
L 或 者 R 后 面 都 有 一 个 与 每 个 字母 表 中 的 符号 对 应 的 状态 索引 ， 第 守 个 状态 索引 给 出 了 当 纸 
带头 包含 的 是 字母 表 中 的 第 i 个 符号 时 ， 从 该 状态 要 如 何 进行 迁移 。 对 于 字母 表 中 的 每 个 符 
号 ， 状 态 索引 后 面 还 有 一 个 对 应 的 符号 。 这 个 符号 表示 的 是 当 纸 带头 包含 的 是 字母 表 中 的 第 
i 个 符号 时 ,第 i 个 符号 将 要 写 回 进 纸 带 的 符号 。 程序 5.2.2 下 面 的 文件 addTM.txt 定义 了 我 |774 
们 的 加 法 器 TM。 775 


程序 5.2.1 ”虚拟 图 灵机 的 磁带 


public class Tape 


private Stack<Character> left = new Stack<Character>(); 
private Stack<Character> right = new Stack<Character>() ; 
private char current; 


public Tape(String input) 
{ 


right.push('#'); 

for (Cint i = input.length(O) - 1; i >= 0; i--) 
right.push(input.charAt(i)); 

current = right.popO; 


public char read() 
{ return current; } 


public void write(char symbo1) 
{ current = symbo]l; 
public void moveLeft() 


right.push(current); 
if (left.isEmpty()) left.push('#"'); 
current = left.popO; 


了 可 
public void moveRight() 


left.push(current); 
if (right.isEmpty()) right.push('#'); 
current = right.popO; 


public String toString() 
{ 请 , 见 练 对 5,2.7:*/ 


这 个 程序 使 用 两 个 下 推 栈 来 模拟 图 灵机 需要 的 无 限 长 磁带 。 磁 带头 下 的 符 
号 保存 在 变量 current 中 ， 磁 带头 左 侧 的 符号 保存 在 左下 推 栈 中 ,磁带 头 右 侧 的 符 
号 保存 在 右 下 推 栈 中 。 
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程序 5.2.2” 通用 虚拟 TM 


public class TuringMachine 






















private String[] action; 
private ST<Character, Integer>[] next; 
private ST<Character, Character>[] out; 


public TuringMachine(String filename) 
{ 休 见 文 本 */ 
public String simulate(String input) 





Tape tape = new Tape(input); 

int state = 0; 

while (action[state] .equals("L") 
|| action[state] .equals("R")) 


if (action[state] .equals("R")) tape.moveRight0); 
if (action[state] .equals("L")) tape.moveLeft(); 
char c = tape.readO; 
tape.write(out[state] .get(c)); 
state = next[state] .get(c) ; 

} 


return action[state] + 


+ tape; 


} 


public static void main(String[] args) 





TuringMachine tm = new TuringMachine(args[0]); 
while (StdIn.hasNextLine()) 
StdOut.printin(tm.simulate(StdIn.readLine())); 








对 于 标准 输入 中 的 每 个 字符 串 的 第 一 个 命令 行 参 数 ， 这 个 程序 模拟 了 TM 的 
操作 。 如 果 TM 停 止 了 ， 程 序 将 打印 Yes 、No 或 者 Halt， 然 后 是 磁带 的 内 容 。 否 
则 ， 这 个 程序 可 能 会 陷入 无 限 循环 。 



















% more addTM.txt % java TuringMachine addTM.txt 
6 01+# 101+11 

R 0001 01+# Halt 1000 

L 二 241 这 全 东魏 10000000011011+11000001 
人 Halt 10000011011100 

L T3309 

R 4445 #### 

Halt 


构造 函数 中 需要 创建 必要 的 数据 结构 ， 这 些 数 据 结 构 应 根据 给 定 的 命令 行 参 数 文件 展现 
TM 的 内 部 信息 ， 如 下 : 
。 读 取 字 母 表 和 状态 数量 。 
。 为 状态 动作 创建 一 个 字符 串 数组 ， 为 L 和 R 两 个 状态 创建 两 个 符号 表 数 组 ， 其 中 一 
个 用 于 存放 状态 迁移 ， 男 一 个 用 于 存放 写 人 的 符号 。 
。 通过 读 取 给 定 文件 的 每 个 状态 的 信息 来 填充 这 些 数 据 结 构 。 
实现 构造 函数 的 代码 很 简单 : 


public TuringMachine(String filename) 
{ 
In in = new In(filename); 
int n = in.readInt(); 
String alphabet = in.readString() ; 
action = new String[n]; 
next = (ST<Character, Integer>[]) new ST[n]; 
out = (ST<Character, Character>[]) new ST[n]; 
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for (int st = 0; st < n; st++) 


action[st] = in.readString(); 

if (action[st].equals("Halt")) continue; 
if (action[st].equals("Yes")) continue; 
if (action[st].equals("No")) continue; 


next[st] = new ST<Character, Integer>O; 
for (int i = 0; i < alphabet.length(); i++) 
int state = in.readInt() ; 
next[st] .put(alphabet.charAt(i) ，state) ; 


out[st] = new ST<Character, Character>(); 
for (int i = 0; i < alphabet.length(); i++) 
: char symbo]l = in.readString().charAt(0); 
out[st] .put(alphabet.charAt(i), symbo]l); 
。 } 
} 
程序 5.1.3 中 的 其 他 方法 也 很 简单 。simulate() 方法 模拟 了 TM 的 操作 ， 而 TuringMachine 
的 main() 方法 在 标准 输入 的 每 一 行 上 都 调用 了 simulate() 方法 。 
程序 5.1.3 既是 一 个 TM 由 什么 构成 的 完整 规范 ， 也 是 研究 特定 TM 属性 的 一 个 必 不 可 
少 的 工具 。 只 要 你 提供 字母 表 、 一 个 TM 的 表格 描述 和 一 系列 输入 字符 串 ， 程 序 就 会 模拟 
TM 执行 对 应 每 个 字符 串 的 操作 。 这 个 简单 的 例子 向 我 们 解释 了 虚拟 机 的 概念 。 这 不 是 一 个 
真正 的 计算 设备 ， 而 是 对 这 类 设备 将 如 何 工作 的 一 个 完整 定义 。 你 可 以 把 TuringMachine 想 
象 成 一 个 “计算 机 ”你 可 以 通过 指定 一 组 遵循 合法 TM 规则 的 状态 和 迁移 在 这 人 台 “ 计 算 机 ” 
上 进行 “编程 ”。 每 个 TM 是 这 台 计 算 机 上 的 一 个 “程序 ”。 
我 们 在 描述 图 灵机 的 时 候 使 用 的 词 、 与 在 5.1 节 中 描述 如 何 实现 一 个 通用 虚拟 DFA 中 
用 到 的 十 分 相像 ， 但 是 DFA 和 图 灵机 之 间 存 在 深刻 的 区 别 : 一 个 图 灵机 可 能 不 会 停止 。 如 
果 给 定 的 图 灵机 在 给 定 的 输入 上 会 进入 无 限 循环 ， 那 么 程序 TuringMachine 也 会 如 此 。 如 何 
防止 这 种 情况 发 生 ， 你 会 在 5:4 节 中 学 到 。 
图 灵机 的 模型 非常 简单 。 它 只 是 一 个 玩具 吗 ? 当然 不 是 ! 在 第 6 章 和 第 7 章 中 ， 你 可 能 
会 惊讶 地 发 现 ， 你 正在 使 用 的 计算 机 实际 土 也 是 基于 一 个 计算 模型 建立 起 来 的 ， 这 个 计算 模 
型 更 接近 于 图 灵机 模型 9 而 不 是 你 熟悉 的 Java 环境 。 更 重要 的 是 ， 图 灵机 模型 让 我 们 能 解 
决 一 系 列 关于 计算 性 质 的 深刻 问题 ， 接 下 来 我 们 会 研究 这 个 问题 。 
问答 环节 
问 : 我 可 以 从 哪里 了 解 更 多 关于 图 灵机 的 知识 ? 
答 : 许多 书籍 都 涉及 这 个 话题 。 我 们 在 文中 提 到 了 马 文明 斯 基 的 《计算 : 有 限 与 无 限 
机 器 》。 如 果 你 想 知道 这 方面 更 先进 的 知识 ， 你 可 以 看 看 迈克 尔 * 西 普 塞 的 《计算 理论 导 引 》 
或 者 大 卫 ， 哈雷 尔 写 的 《计算 机 的 极限 : 它们 真正 不 能 办 到 的 事 》。 
问 : 我 可 以 从 哪里 了 解 更 多 关于 艾 伦 ' 图 灵 的 知识 ? 
答 : 有 几 本 值得 注意 的 传记 记载 了 艾 伦 ' 图 灵 的 生活 故事 和 遗留 财富 ”这 之 中 就 包括 安 
德 鲁 ' 霍 奇 斯 写 的 《 艾 伦 * 图 灵 传 》。 由 本 尼 迪 克 特 : 康 伯 巴 奇 主演 的 《模仿 游戏 》 就 是 基 
于 霍 奇 斯 写 的 这 本 传记 拍摄 的 一 部 电影 。 
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问 : 我 真 的 需要 弄 清楚 应 该 如 何 从 头 开始 设计 图 灵机 吗 ? 

答 : 你 可 以 像 做 其 他 事 一 样 ， 一 边 做 一 边 学 。 是 的 ， 你 不 太 可 能 在 将 来 的 工作 中 真 的 需 
要 部 署 一 个 TM。 但 是 如 果 你 能 够 牢 牢 掌握 我 们 在 本 节 中 所 涵盖 的 那些 TM 的 基本 特征 ， 你 
将 更 容易 理解 我 们 是 如 何 解 决 那些 计算 问题 的 。 毫 无 疑问 ,TM 设计 是 一 个 益 智 练习 。 你 不 
需要 做 完 所 有 的 练习 一 一 只 需要 做 那些 你 感 兴趣 的 就 行 了 (或 者 是 分 配 好 的 那些 练习 ! )。 


练习 

5.2.1 我 们 在 右 侧 给 出 了 一 个 图 灵机 操作 的 轨迹 ， 这 个 轨迹 对 应 的 输入 为 ”,a:0 b:1 
aabaabaabb。 请 你 为 这 个 机 器 执行 的 计算 做 一 个 简短 的 语言 说 明 。 (@ Se/ -@ 

5.2.2 ”从 本 书 网 站 上 下 载 TuringMachine.java 和 Tape.java,， 创 建文 本 文件 
incrementerTM.txt 和 addTM.txt， 然 后 在 这 些 机 器 上 运行 各 种 各 样 的 输入 ， 最 后 验证 这 些 机 器 
是 否 按照 描述 的 那样 进行 操作 。 


5.2.3 创建 一 个 文本 文件 ， 这 个 文件 提供 了 练习 5.2.1 中 所 描述 的 图 灵机 的 表格 信息 。 从 本 书 网 站 上 
下 载 TuringMachine.java 和 Tape.java， 然 后 通过 在 机 器 上 运行 各 种 输入 来 检查 练习 5.2.1 的 答 


案 是 否 正 确 。 4 S 
5.2.4 ”我 们 在 右 侧 给 出 了 一 个 图 灵机 操作 的 轨迹 ， 这 个 轨迹 全 -一 多 
对 应 的 输入 为 aabaabaa。 请 你 为 这 个 机 器 执行 的 计算 a:# a:# je 
做 一 个 简短 的 语言 说 明 。 : 二 » 
5.2.5 创建 一 个 文本 文件 ， 这 个 文件 用 于 记录 右 侧 图 灵机 的 才 要 ny 
表格 信息 。 从 本 书 网 站 上 下 载 TuringMachine.java 和 te NN 
Tape.java， 然 后 通过 在 机 器 上 运行 各 种 输入 来 检查 练 


习 5.2.4 的 答案 是 否 正 确 。 

5.2.6 ”下面 所 画 的 图 灵机 是 一 个 进行 三 进 制 数 字 除 法 的 图 灵机 : 给 定 两 个 二 进 制 数 字 ， 它们 之 间 用 
“ 二” 分隔， 这 个 图 灵机 应 该 在 纸 带 上 的 两 个 字符 串 之 后 加 上 等 号 ,后面 跟 着 计算 的 结果 。 例 
如 对 于 输入 “1111111111 = 11”， 纸 带 上 的 结果 应 为 “1111111111 +11=11111”。 将 图 中 的 “?” 
符号 替换 为 正确 的 符号 ， 使 得 该 图 灵机 能 够 得 到 正确 的 计算 结果 。 


-pe 
de 


5.2.7 向 Tape 中 增加 实现 toString() 方 法 的 代码 。 为 了 使 输出 与 程序 $.2.2 相 匹配 ， 请 不 要 显示 
符号 “#”。 

5.2.8 向 TuringMachine 中 添加 实现 以 下 功能 的 代码 : 在 每 次 机 器 发 生 状 态 迁 移 时 ， 打 印 出 出 一 行内 
容 ， 包 括 状 态 名 称 、 纸 带头 位 置 和 纸 带 内 容 。 修 改 Tape 中 的 toString() 方法 使 其 将 元 符号 “#” 
保留 下 来 ， 然 后 打印 一 对 方 括号 ， 将 纸 带头 所 处 的 符号 填 人 方 括号 中 ， 通 过 使 用 这 种 方法 标记 
纸 带 头 的 位 置 。 

以 下 每 个 练习 都 要 求 你 “设计 一 个 图 灵机 ”。 一 个 合适 的 答案 中 应 该 包括 这 个 机 器 的 图 和 
语言 文本 。 文 本 要 包括 : 一 个 文本 文件 给 出 机 器 的 一 个 表格 信息 ; 还 要 给 出 对 于 典型 输入 图 灵 
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机 生成 的 轨迹 ， 这 个 轨迹 就 如 练习 5.2.8 中 所 示 。 


5.2.9 设计 一 个 图 灵机 ， 用 于 识别 一 种 语言 的 字符 串 是 否 包 含 相同 数目 的 符号 A、B 和 C。 


S26 


设计 一 个 二 进 制 减 法 器 图 灵机 ， 这 个 图 灵机 与 我 们 的 二 进 制 加 法 器 正好 相反 ， 同 时 它 能 删除 
所 有 前 导 0。 例 如 ，#10000# 递减 的 结果 应 该 为 #111# 9。 


5.2.11 设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 所 有 符号 的 数量 为 2 的 宕 次 方 。 

5.2.12 ”设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 由 长 度 为 奇数 且 最 中 间 的 符号 为 “|” 的 二 进 制 字 
符 串 组 成 。 

5.2.13 ”设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 的 字符 串 形 式 为 : 前 面 为 n 个 a 符号 后 面 跟 n 个 b 
符号 ， 其 中 对 为 正 整数 。 

5.2.14 ”设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 由 所 有 二 进 制 回 文 组 成 。 

5.2.15 ”设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 由 所 有 包含 完整 格式 的 圆 括号 的 字符 串 组 成 : (), (0 
0，(00)，(((0(0)))) 等 。 

5.2.16 ”设计 一 个 判定 某 种 语言 的 图 灵机 ， 这 种 语言 为 ; 在 两 个 相同 的 十 进 制 数字 间 插 入 一 个 “|” 符 
号 隔 开 。 

5.2.17 设计 一 个 可 以 为 输入 的 纸 带 制作 副本 的 图 灵机 。 例 如 纸 带 一 开始 记录 的 是 abcd， 则 最 终 纸 带 
上 应 该 留 下 abcd#abcd。 

5.2.18 设计 一 个 图 灵机 ， 这 个 图 灵机 会 收 到 由 “x” 分 隔 的 两 个 一 元 字符 串 ， 将 这 两 个 字符 串 相 乘 ， 
然后 在 纸 带 的 两 个 字符 串 后 面 加 上 等 号 ， 再 在 等 号 后 面 加 上 结果 。 例 如 输入 11x11111， 纸 带 
上 的 结果 应 该 为 : 11x11111=1111111111。… 

5.2.19 设计 一 个 用 三 进 制 计 数 的 图 灵机 。 最 开始 时 纸 带 应 该 是 空 的 。 随 机 机 器 的 运行 ， 纸 带 应 该 包 
含 1、10、11、100、101、110 等 ， 并 且 不 停 地 继续 增加 。 

5.2.20 ”设计 一 个 图 灵机 ， 这 个 图 灵机 会 收 到 由 “^” 分 隔 的 两 个 相等 长 度 的 三 进 制 字符 串 ， 并 且 在 纸 
带 上 留 下 两 个 字符 串 按 位 取 或 的 结果 。 

5.2.21 设计 一 个 图 灵机 ， 它 以 最 前 位 为 1 的 二 进 制 整数 为 输入 ， 并 且 在 纸 带 中 留 下 这 个 整数 的 位 数 
的 二 进 制 表示 。 这 个 函数 被 称 为 离散 二 进 制 对 数 函 数 。 

创新 练习 

5.2.22 ”有 效 的 加 法 器 。 设计 一 个 与 正文 中 所 提 到 的 图 灵机 类 似 的 图 灵机 ， 这 个 图 灵机 以 两 个 用 “+” 
分 隔 的 二 进 制 字符 串 为 输入 ， 将 这 两 个 字符 串 解 释 成 二 进 制 数 字 ， 并 将 它们 相 加 ， 然 后 将 结 
果 留 在 纸 带 上 。 不 同 于 文中 的 TM， 你 的 机 器 的 运行 时 间 应 该 由 一 个 关于 数字 长 度 的 多 项 式 决 
定 ， 而 不 是 这 些 数字 的 大 小 。 

5.2.23 ”有 效 的 比较 器 。 设 计 一 个 与 文中 所 提 到 的 图 灵机 类 似 的 图 灵机 ， 这 个 图 灵机 以 两 个 用 “?” 分 
隔 的 二 进 制 字符 串 为 输入 ， 将 这 两 个 字符 串 解 释 成 二 进 制 数字 ， 如 果 第 一 个 数字 小 于 第 二 个 
则 进入 “Yes” 状 态 ， 和 否则 进入 “No” 状 态 。 确 保 你 的 机 器 的 运行 时 间 应 该 由 一 个 关于 数字 
长 度 的 多 项 式 决定 ， 而 不 是 这 些 数字 的 大 小 。 

5.2.24 龙 形 曲 线 。 设计 一 个 图 灵机 ， 这 个 图 灵机 的 输入 纸 带 最 初 只 有 一 个 有 2”-1 个 0 的 序列 ， 最 后 


会 在 纸 带 上 留 下 指令 来 绘制 一 条 龙 的 曲线 ( 见 练习 1.2.35 )。 使 用 以 下 算法 : 在 LL 和 RR 之 间 交 
替 地 使 用 工 或 RR 来 替换 0。 


日 ”此 处 原 书 中 有 错误 。 一 一 译 者 注 
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5.2.25 克拉 茨 TM。 设 计 一 个 图 灵机 ， 这 个 图 灵机 以 一 个 整数 的 三 进 制 表示 作为 输入 ， 如 果 这 个 整数 
是 偶数 ， 则 对 它 除 以 2 ; 如 果 这 个 数 是 奇数 ， 则 对 它 乘 以 3 后 加 1， 重 复 此 过 程 直到 结果 等 于 
1。 这 就 是 克拉 蒋 函 数 ， 关 于 这 个 机 器 是 否 对 于 所 有 的 输入 都 能 终止 , 这 个 问题 仍然 在 讨论 当 
中 ( 见 练习 2.3.29 )。 


5.3 普遍 性 

图 灵机 模型 本 质 上 是 一 个 数学 作品 ， 它 将 有 关 计 算 的 基本 数学 概念 简化 ， 以 使 我 们 可 以 
得 出 精确 结论 。 这 项 工作 的 基础 是 由 图 灵 在 他 最 初 的 论文 里 提出 来 的 ， 但 随后 学 者 们 不 断 地 
发 展 ， 直 到 今天 我 们 被 各 种 计算 设施 所 包围 ， 都 有 赖 于 图 灵机 模型 得 出 的 这 些 结论 。 图 灵机 
有 如 此 巨大 的 影响 力 ， 我 们 所 有 从 事 于 计算 的 人 (当然 ， 也 包括 本 书 的 读者 ) 都 有 必要 对 其 
有 个 基本 理解 。 在 本 节 中 ， 我 们 试图 讲解 图 灵 在 那 篇 论文 中 提出 的 两 全 基本 概念 : 一 是 一 台 
通用 目的 的 计算 机 可 以 进行 任何 计算 ; 二 是 假设 所 有 计算 设备 本 质 上 是 等 价 的 。 

算法 ” 当 我 们 写 一 个 计算 机 程序 时 ， 我 们 通常 是 在 设计 一 种 可 以 解决 某 个 问题 的 方法 。 
这 个 方法 必须 依赖 于 程序 环境 ， 或 者 这 个 方法 适用 于 很 多 环境 。 正 是 方法 ， 而 不 是 程序 本 
身 ， 带 领 我 们 一 步 步 地 解决 问题 。 在 计算 机 理论 中 ， 名 词 “ 算 法 ”(algorithm) 用 来 描述 实现 
计算 机 程序 中 有 限 的 、 确 定 的 、 有 效 地 解决 问题 的 办 法 。 算 法 是 计算 机 科学 理论 中 的 核心 
领域 。 

在 本 书 中 ,我 们 已 经 学 习 了 很 多 算法 ， 比 如 牛顿 定理 、 欧 几 里 得 定理 、 归 并 排序 、 广 度 
优先 搜索 等 。 这 里 给 出 的 定义 虽然 不 够 严谨 ， 但 也 足够 说 明 这 个 概念 。 图 灵机 给 数学 家 们 带 
来 了 这 个 概念 ， 并 可 用 于 数学 证 明 。 在 这 里 ， 我 们 关注 于 这 些 重要 的 思路 ， 而 不 再 停留 于 定 
义 及 其 完整 版 证 明 。 

可 判定 性 。 假 设 我 们 在 纸 带 上 输入 一 个 字符 串 并 将 一 个 图 灵机 处 于 启动 状态 ， 有 四 种 可 
能 的 结果 。 该 机 器 可 能 : 

。 停 在 标 有 “YES” 的 状态 (接受 输入 字符 串 )。 

。 停 在 标记 为 “NO” 的 状态 (拒绝 输入 字符 串 )。 

。 停 在 标 有 “H” 的 状态 (停止 ,不 再 接受 或 拒绝 )。 

。 以 上 都 不 是 (进入 无 限 循环 )。 

目前 ， 当 机 器 停机 时 或 处 于 无 限 循环 中 )， 我 们 会 忽略 纸 带 前 后 的 内 容 。 我 们 说 一 个 
图 灵机 识别 某 个 语言 ， 是 指 图 灵机 以 这 个 语言 的 所 有 可 能 的 字符 串 作 为 输入 时 ， 都 会 引导 机 
器 最 终 走 到 接受 状态 。 同 时 ， 对 于 所 有 不 在 所 识别 的 语言 中 的 输入 字符 串 ， 图 灵机 都 会 停止 
运行 (终止 于 标记 为 “NO” 或 “H” 的 状态 )， 那 么 我 们 就 说 这 个 图 灵机 可 以 判定 ( decide) 
该 语言 。 对 于 每 一 个 输入 字符 串 ， 这 个 图 灵机 必须 都 能 停机 并 且 给 出 正确 的 答案 。 例 如 ， 我 
们 在 前 一 节 末尾 设计 的 三 进 制 频率 计数 器 图 灵机 人 能够 判定 (和 识别 ) 所 有 a 和 b 数量 相同 的 
二 进 制 字符 串 。 注 意 : 对 于 DFA， 当 DFA 总 是 停止 时 ， 我 们 不 需要 区 分 判定 和 识别 。 

可 计算 性 。 把 输出 纸 带 也 考虑 在 内 ， 我 们 就 可 以 将 图 灵机 的 可 用 性 和 可 判定 性 扩展 到 函 
数 的 属性 。 例 如 ， 练 习 5.2.21 中 要 求 TM 计算 离散 二 进 制 对 数 函 数 。 如 果 在 某 个 图 灵机 上 ， 
当 它 的 纸 带 被 初始 化 为 x， 它 就 将 f(x) 的 计算 结果 留 在 纸 带 上 ， 我 们 就 说 函数 f(x) 是 可 计算 
的 〈computable)。 我 们 可 以 将 整数 表示 为 二 进 制 字符 串 或 十 进 制 数字 的 字符 串 ， 或 使 用 任 
何其 他 合理 的 表示 。 所 有 关于 整数 的 常用 操作 ( 增 量 、 加 法 、 减 法 、 乘 法 、 模 数 除法 、 指 数 ) 
都 是 可 计算 的 函数 。 
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这 些 可 判定 性 和 可 计算 性 的 概念 帮助 我 们 精确 地 捕捉 了 术语 “算法 ”的 含义 : 判定 某 种 
语言 或 计算 某 个 函数 的 图 灵机 就 代表 了 完成 该 任务 的 算法 。 正 如 我 们 经 常 考虑 多 种 算法 来 解 
决 编程 问题 一 样 ， 每 个 特定 任务 可 能 会 有 许多 图 灵机 。 在 计算 理论 中 ， 图 灵机 和 算法 这 两 个 
术语 可 以 互 换 使 用 ， 使 我 们 能 够 用 严谨 的 数学 方法 对 “所 有 算法 ”或 “针对 特定 任务 的 所 有 
算法 ”进行 详尽 的 陈述 。 

处 理 程序 的 程序 ”为 了 让 你 进入 理论 讨论 的 思维 模式 ,我们 先 离 题 ， 简 要 地 讨论 一 下 
“处 理 程序 的 程序 ”这 一 概念 ， 即 程序 将 另 一 个 程序 作为 输入 (并 且 可 能 产生 另 一 个 程序 作 
为 输出 )。 经 过 回顾 ， 你 一 定 会 意识 到 经 常用 到 处 理 程序 的 程序 。 例 如 ， 移 动 设备 上 的 每 个 
应 用 程序 都 是 一 个 程序 : 当 你 下 载 一 个 新 的 应 用 程序 时 ， 你 会 用 到 服务 器 主机 上 的 一 个 程 
序 ， 这 个 程序 使 用 你 要 下 载 的 App 程序 作为 输入 ， 并 将 它 打包 输出 (发 送 给 你 ); 同样 的 道 
理 ， 在 移动 设备 上 存在 另 一 个 程序 ， 该 程序 以 刚才 的 App 程序 作为 输入 (以 接收 应 用 程序 )， 
也 会 有 另 一 个 程序 (操作 系统 ) 来 启动 这 个 App 程序 。 

Java 开发 环境 。 我们 在 1.1 节 中 介绍 过 Java 开发 环 ol 一 上 | 5] 

境 中 两 个 处 理 程序 的 程序 ， 就 是 我 们 一 直 用 到 现在 的 Java 
编译 器 (我 们 将 在 6.4 节 中 再 详细 介绍 其 原理 )。Java 编 | a | 字 节 码 
译 器 将 Java 代码 转换 为 另 一 种 称 为 Java 字 节 码 的 编程 语 


言 ， 然 后 由 (通用 ) Java 虚拟 机 (JVM) 将 以 该 字 节 码 编 > SH Java 

写 的 任何 程序 作为 输入 ， 并 最 终 使 用 另 一 种 编程 语言 ( 即 5 
计算 机 的 机 器 语言 ) 来 运行 它 。JVM 实际 上 是 用 另 一 种 编 

程 语言 ， 即 C 语 言 编程 语言 编写 的 程序 ，C 语言 比 Java ”中信 表 一 LpEA| 


更 老 、 更 底层 ， 但 也 常见 于 大 多 数 计算 机 。 大 型 呈 

通用 虚拟 DFA (Java 实现 )。 我 们 的 程序 DFA (程序 “< 下 
5.1.3 ) 以 DFA 的 状态 表 描述 作为 输入 ， 然 后 模拟 该 机 器 负 各 和 所 站 四 樟 
的 操作 。 正 如 我 们 在 5.1 节 结 束 时 所 讨论 的 那样 ， 可 以 这 样 理解 我 们 的 工作 ， 将 状态 表 的 编 
写 规则 作为 编程 语言 ， 将 每 个 DFA 状态 表 描 述 的 定义 作为 以 该 语言 编写 的 程序 。 所 以 DFA 
是 一 个 Java 程序 ， 它 将 “程序 ”( 特 定 DFA 的 描述 ) 作为 输 和 入。 另外， 执行 5.1 节 末 尾 描 
述 的 将 任何 NFA 转换 为 DFA 的 过 程 (请 参见 练习 5.1.39 )， 需 要 一 个 Java 程序 将 一 个 程序 
(一 个 NFA 转换 表 ) 作为 输入 ， 并 生成 一 个 程序 (一 个 DFA 状态 表 ) 作为 输出 。 

通用 虚拟 DFA( TM 实现 )。 当 然 ， 并 不 是 每 个 程序 都 需要 在 Java 中 实现 ! 事实 上 ， 甚 
至 有 可 能 创建 一 个 处 理 程序 的 图 灵机 。 例 如 ， 练 习 5.3.2 中 描述 的 TM 模拟 了 一 个 使 用 二 进 
制 符 号 表 的 三 态 DFA 的 操作 (采用 相同 的 设计 进行 直接 的 扩展 ， 可 以 处 理 更 多 状态 和 更 大 
符号 集 )。 它 需要 (在 TM 纸 带 上 ) 输入 任何 三 态 DFA 的 状态 表 和 该 DFA 的 二 进 制 输入 字符 
串 ， 并 根据 该 输入 模拟 DFA 的 操作 ， 如 果 输 入 字符 串 是 可 以 被 DFA 接受 的 语言 ， 输 出 状态 
码 为 Yes， 如 果 不 是 则 为 No ( 见 练习 5.3.4 )。 在 这 种 情况 下 ,我 们 有 一 个 Java 程序 它 把 
一 个 程序 (一 个 TM 状态 表 ) 作为 输入 ,这 个 程序 就 是 以 一 个 程序 (一 个 DFA 状态 表 ) 作为 
输入 ! 

总 之 ， 处 理 程序 的 程序 是 计算 的 基础 ， 我 们 当然 可 以 创建 处 理 程 序 的 图 灵机 。 图 灵 在 计 
算 机 出 现 之 前 就 构想 了 这 些 事实 的 意义 ， 这 是 非常 了 不 起 的 。 

通用 图 灵机 。 由 于 我 们 可 以 创建 一 个 TM 来 模拟 任何 给 定 输 入 上 的 任何 DFA 的 操作 ， 
那么 我 们 可 以 创建 一 个 TM 来 模拟 任何 给 定 输入 上 的 任何 图 灵机 的 操作 吗 ? 这 个 问题 的 答案 
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是 肯定 的 ! 这 是 图 灵 论 文 的 贡献 。 这 种 机 器 被 称 为 通用 图 灵机 (Universal Turing Machine， 
UTM)。 

我 们 在 本 书 中 没有 开发 完整 的 UTM，, 但 是 如 果 你 尝试 完成 练习 5.3.2， 就 可 以 看 到 如 何 
解决 这 个 问题 : 

。 扩 展 输 入 格式 以 包含 重 写 符号 。 

。 开 发 一 个 TM 的 附属 程序 Tape (程序 5.2.2 )， 以 模拟 正 被 模拟 的 机 器 的 纸 带 。 

。 将 纸 带 操作 添加 到 练习 5.3.2 实现 的 模拟 通用 虚拟 DFA 的 TM 中 。 

。 添加 一 个 机 制 来 跟踪 当前 状态 (而 不 是 复制 所 有 状态 的 “代码 ”， 这 需要 知道 状态 的 

数量 )。 

在 目前 的 情况 下 ， 我 们 并 不 是 要 求 你 实现 并 确认 所 有 这 些 细 节 (即使 图 录 最 初 的 UTM 
也 有 漏洞 ) 只 是 想 说 服 你 ， 自 己 建造 这 样 一 台 机 器 是 一 个 合理 的 练 闷 ， 虽 然 这 已 经 超出 了 
本 书 的 范围 。 现 在 你 已 经 知道 UTM 是 存在 的 ,那么 你 就 已 经 为 接 下 来 我 们 要 研究 的 实现 细 
节 做 好 了 准备 。 

如 果 你 有 兴趣 研究 细节 ， 你 可 以 在 我 们 的 网 站 上 找到 一 个 24 个 状态 、7 个 符号 的 

789| UTM， 以 及 一 个 图 形 化 的 虚拟 通用 TM， 你 可 以 利用 它 来 直观 地 追踪 操作 过 程 。 

通用 计算 机 。 假 如 你 的 计算 机 上 安装 有 Java， 并 能 够 运行 TuringMachine, 那 它 就 是 一 
个 通用 的 虚拟 图 灵机 : 它 能 够 运行 不 同 的 算法 ， 而 不 需要 任何 硬件 修改 。 你 将 在 第 6 章 和 
第 7 章 中 看 到 细节 ， 但 是 现在 简单 地 意识 到 这 个 任务 的 可 行 性 就 好 了 。 因 为 现代 处 理 器 基于 
站“， 诺 依 曼 架构 ， 在 这 种 架构 下 计算 机 程序 和 数据 都 存储 在 主 存储 器 中 。 这 就 意味 着 ， 内 存 
的 内 容 是 被 视 为 机 器 指令 还 是 数据 ， 取 决 于 程序 执行 的 上 下 文 。 这 种 安排 与 UTM 的 纸 带 完 
全 相似 ， 它 也 是 由 一 个 程序 (原始 TM) 及 其 数据 (原始 TM 的 纸 带 内 容 ) 组 成 。 

因此 ， 图 灵 在 UTM 方面 的 工作 预见 了 通用 计算 机 的 发 展 ， 从 法 律 的 角度 甚至 可 以 把 他 
视 为 软件 的 发 明 人 ! 你 可 以 设计 一 台 机 器 并 为 它 编 程 来 执行 各 种 任务 ， 而 不 是 为 不 同 的 任务 
设计 不 同 的 机 器 。 例 如 ， 你 可 以 用 同样 的 设备 来 分 析 实 验 数据 、 撰 写 论 文 ; 处 理 图 片 、 音 乐 
和 电影 ; 浏览 网 页 ; 通过 社交 媒体 进行 沟通 以 及 下 棋 等 。 

印 奇 = 图 灵 论 题 图 灵 坚 信 ， 他 的 模型 体现 的 理念 是 一 个 理想 化 的 数学 家 按照 明确 的 
程序 进行 计算 的 过 程 。 几 乎 在 同一 时 间 (实际 上 早 一 点 )， 阿 隆 索 * 印 奇 (Alonso Church) 发 
表 了 一 个 完全 不 同 的 数学 模型 来 研究 可 计算 性 的 概念 。 事 实证 明 ， 吨 奇 的 模型 ， 即 Lambda 
演算 (lambda calculus)， 直 接 导致 了 现代 函数 式 编程 语言 的 发 展 。 在 计算 方面 ， 这 些 模型 似 
乎 有 很 大 不 同 ,但 图 灵 后 来 证 明 它 们 是 等 价 的 ， 因 为 它们 都 表征 了 完全 相同 的 一 组 数学 函 
数 。 虽 然 他 们 的 研究 纯粹 是 理论 性 的 ， 但 这 个 等 价 的 结论 使 得 图 灵 和 印 奇 在 计算 的 研究 上 得 
出 了 一 致 的 结论 。 图 灵 关 注 的 是 一 个 数学 家 理想 化 地 对 整数 函数 的 计算 ， 印 奇 关注 的 是 纯 函 
数 , 但 最 终 他 们 意识 到 他 们 对 于 真实 世界 的 抽象 有 一 点 是 相同 的 : 所 有 物理 上 可 实现 的 计算 
设备 都 可 以 被 图 灵机 模拟 。 这 就 将 现实 世界 中 计算 的 研究 简化 到 对 图 灵机 的 研究 ， 有 效 地 控 

制 了 计算 设备 的 类 型 。 我 们 用 通用 图 灵机 的 概念 来 正式 地 表述 这 个 论题 : 
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这 个 论题 的 逆 否 命题 也 是 有 趣 的 。 它 表明 ， 如 果 一 个 计算 任务 不 能 在 图 灵机 上 完成 那 
么 使 用 任何 物理 上 可 实现 的 计算 设备 也 是 无 法 完成 的 。 正 如 我 们 将 在 5.4 节 看 到 的 那样 ， 确 
实 有 图 灵机 不 能 识别 的 语言 。 因 此 ， 如 果 我 们 相信 印 奇 - 图 灵 论 题 ， 我 们 就 必须 承认 ， 我 们 
在 物理 上 可 实现 的 计算 设备 能 够 完成 的 计算 任务 是 有 限制 的 。 

TM 模型 的 变 体 ”一些 支持 邱 奇 - 图 灵 论 题 的 证 据 与 研究 图 灵机 模型 的 改变 是 否 有 作用 
有 关 。 一 方面 ， 对 于 某 种 TM 无 法 识别 的 语言 或 者 无 法 计算 的 函数 ， 研 究 人 员 一 直 在 研究 能 
否 向 机 器 中 添加 机 制 来 使 得 可 以 识别 或 计算 ; 另 一 方面 ,研究 人 员 一 直 在 研究 如 何在 不 削弱 
模型 的 功能 前 提 下 简化 图 灵机 模型 。 请 记 住 ， 在 目前 的 情况 下 ， 我 们 并 不 关心 一 台 机 器 可 能 
使 用 多 少 个 状态 或 符号 ,或 者 一 个 计算 可 能 需要 多 少 个 状态 迁移 一 一 而 是 只 关心 计算 能 力 ， 
即 多 少 语言 可 以 被 识别 、 多 少 函数 可 以 被 计算 。 

等 效 模型 。 本 书 作 者 习惯 于 使 用 图 灵 原 始 模型 的 轻微 变 体 ， 就 像 我 们 前 文 讨论 过 的 
Minsky 开发 的 模型 ， 通 常 非常 容易 观察 出 来 发 生 了 什么 改变 ， 因 此 不 再 进行 额外 的 说 明 。 
其 实 这 些 选择 只 是 为 了 方便 起 见 。 我 们 相信 ， 我 们 的 版 本 及 其 生成 的 表格 简单 易 懂 。 关 于 
计算 理论 的 高 级 教科 书 的 作者 可 能 会 选择 不 同 的 版 本 ， 从 而 生成 更 简单 的 证 明 。 例 如 ， 常 
见 的 选择 是 将 纸 带头 移动 与 每 个 状态 迁移 相关 联 ， 而 不 是 与 目标 状态 相关 联 。 我 们 在 5.2 
节 中 提 到 的 另 一 个 等 效 模型 是 一 个 双 栈 下 推 自动 机 一 一 这 个 名 字 非 常 直观 ,我们 在 程序 
TuringMachine 中 确实 使 用 两 个 栈 。 

增强 。 关 于 TM 模型 的 研究 已 经 非常 深入 ， 并 且 得 到 了 一 系列 可 能 的 改进 。 例 如 ， 是 否 
会 添加 另 一 个 带 有 独立 纸 带头 的 纸 带 使 TM 模型 更 强大 ? 这 个 问题 的 答案 是 否定 的 ， 因 为 我 
们 可 以 用 TM 来 模拟 这 样 的 机 器 ， 用 纸 带 奇数 位 置 表 示 一 个 纸 带 ， 偶 数位 置 表 示 另 一 个 纸 
带 。 再 举 一 个 例子 ， 考 虑 为 系统 添加 非 确定 性 功能 的 价值 。 
结果 是 这 不 会 提升 TM 的 功能 ， 因 为 使 用 类 似 于 为 NFA 构造 ”DEA 状态 到 
DFA 的 方法 ,我 们 可 以 为 不 确定 性 TM 构建 一 个 确定 性 TM， 

它 识别 相同 的 语言 或 者 计算 功能 可 以 完全 相同 。 下 面 会 有 更 

多 的 示例 。 我 们 省 略 了 进一步 的 讨论 和 证 明 ， 要 指出 的 是 。 “图 及 机 杖 态 表 一 -| UTM | 
尽管 经 过 了 数 十 年 的 努力 ， 仍 没有 人 成 功 找到 更 强大 的 、 物 ”额外 两 种 处 理 程序 的 程序 
理 可 实现 的 模型 。 

限制 。 研 究 人 员 还 试图 简化 图 灵机 模型 。 在 下 面 的 表格 中 显示 了 几 个 例子 。 例 如 ， 仅 顺 
着 一 个 方向 使 用 无 限 纸 带 是 没有 限制 的 ， 因 为 我 们 可 以 在 一 个 方向 上 使 用 奇数 位 置 ， 另 一 个 
方向 使 用 偶数 位 置 。 作 为 男 一 个 例子 ,使 用 二 进 制 符号 表 是 没有 限制 的 ， 因 为 我 们 可 以 用 二 
进 制 编码 纸 带 符号 。 我 们 再 次 省 略 细节 和 进一步 的 讨论 证 明 。 当 然 ， 正 如 我 们 所 看 到 的 ，DFA 
模型 不 如 TM 模型 功能 强大 ，DFA 可 以 看 作 二 个 不 能 写 入 纸 带 且 纸 带 只 能 在 一 个 方向 上 移动 
的 TM。 寻找 最 简单 的 TM 模型 是 吸引 了 许多 研究 人 员 的 目标 ,我们 将 很 快 回 到 这 个 话题 。 


So 
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图 灵机 变 体 描述 
等 效 模型 
了 L 和 R 移 动 与 每 个 迁移 
移动 迁移 相关 联 ， 而 不 是 目标 状态 
双 栈 PDA 双 栈 下 推 自动 机 
增强 
a 添加 有 限 数量 的 带 
独立 磁带 头 的 独立 磁带 
rr 使 用 多 维 磁带 ( 允许 磁带 
头 向 任何 方向 移动 ) 
不 确定 性 允许 任何 输入 字符 的 多 重 迁 移 
bub 迁移 是 随机 选择 的 如 果 大 多 数 
基于 概率 结果 导致 接受 状态 ， 则 接受 ) 
不 经 意 性 迁移 不 依赖 于 输入 
限制 
单 向 无 限 磁带 只 有 一 个 方向 是 无 限 的 
一 进 制 只 允许 两 个 符号 
双 态 只 允许 两 种 状态 
非 擦 除 没有 履 盖 能 力 
ne 状态 是 环形 排列 的 只 能 从 
, 一 个 状态 转换 到 下 一 个 状态 ) 
功能 没有 受到 影响 的 TM 变 体 


对 于 同一 种 语言 的 识别 问题 或 者 同一 个 计算 函数 ， 有 数 以 百 计 甚至 数 千 篇 的 论文 和 书籍 
来 讨论 图 灵 模 型 的 变 体 。 这 一 事实 无 疑 表 明 ， 该 模型 至 少 是 我 们 理解 计算 的 一 个 转折 点 一 一 
从 单 栈 PDA 到 图 灵 等 效 双 栈 PDA 的 步骤 确实 是 一 个 巨大 的 进步 。 

通用 模型 ”如 果 模 型 等 同 于 图 灵机 模型 ( 它 可 以 识别 同一 组 语言 或 完成 相同 的 计算 函 
数 )， 则 称 模型 为 图 灵 完 备 模 型 或 图 灵通 用 模型 。 印 奇 - 图 灵 论 题 表 明 ， 图 灵机 是 自然 界 中 
的 一 个 基本 对 象 。 是 否 有 其 他 计算 模型 可 以 像 图 灵机 那样 运行 基于 任何 输入 的 任何 程序 呢 ? 
当然 ， 答 案 是 肯定 的 ! 一 个 世纪 以 来 ,许多 数学 家 、 计 算 机 科学 家 、 物 理学 家 、 语 言 学 家 
和 生物 学 家 已 经 考虑 了 许多 其 他 的 计算 模型 ， 这 些 模型 已 被 证 明 是 图 灵 完 备 模型 。 在 后 面 的 
表格 中 列 出 了 其 中 的 一 部 分 。 我 们 在 这 里 只 重点 介绍 其 中 的 一 些 内 容 。 

拉 姆 达 演 算 ( Lambda calculus)。 正 如 前 文 提 到 过 的 ， 当 图 灵 正 在 普林斯顿 大 学 准备 他 的 论 
文 时 ， 印 奇 正在 完成 他 的 拉 姆 达 ( 4 ) 演算 工作 ， 这 是 一 个 正式 的 系统 ， 是 现代 函数 式 编程 的 基 
础 。 认 识 到 印 奇 的 拉 姆 达 演 算 和 图 灵 的 机 器 模型 是 相同 的 ， 这 也 正 是 印 奇 - 图 灵 论 题 的 论点 。 

计数 机 。 比 图 灵机 更 简单 的 模型 是 计数 机 ， 它 由 明 斯 基 推 广 。 其 中 纸 带 由 一 小 组 计数 器 
代替 ， 这 些 计 数 器 可 以 保存 任何 整数 ;由 一 小 部 分 指令 取代 一 组 操作 来 表示 状态 和 迁移 ， 如 
“ 增 量 ”“ 减 量 ” 和 “如 果 为 零 则 跳跃 ”。 

元 胞 自动 机 。 你 可 能 熟悉 生命 的 游戏 ( Game of Life)， 这 是 由 数学 家 约翰 : 康 威 设计 
的 计算 模型 ( 详 见 练习 2.4.20 和 练习 5.3.19 ) 。 这 个 游戏 是 元 胞 自动 机 的 一 个 例子 ， 元 胞 自 
动机 是 细胞 与 邻居 交互 的 离散 系统 。 元 胞 自动 机 的 研究 始 于 20 世纪 40 年 代 ， 其 提出 者 约 
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翰 : 冯 … 诺 依 曼 是 计算 史上 的 一 个 重要 人 物 ， 你 将 在 第 6 章 看 到 。 

你 的 计算 机 。 正 如 我 们 已 经 知道 的 ，TuringMachine (程序 5.2.2 ) 证 明 你 的 计算 机 至 少 
与 任何 图 灵机 一 样 强大 ， 因 为 它 可 以 模拟 任何 图 灵机 的 行为 。 但 是 ， 你 可 能 会 惊讶 地 发 现存 
在 可 以 模拟 你 的 计算 机 操作 的 图 灵机 。 正 如 将 在 第 6 章 和 第 7 章 里 介绍 的 ， 你 会 发 现 计算 
机 的 基础 是 一 个 包含 处 理 二 进 制 数字 指令 的 机 器 模型 。 相 比 Java 环境 ， 这 个 机 器 模型 与 图 
灵机 更 类 似 。 开 发 能 够 模拟 这 种 机 器 的 图 灵机 在 概念 上 并 不 困难 。 因 此 ， 如 果 你 可 以 在 计算 
机 上 开发 可 以 判定 某 种 语言 或 计算 某 些 功能 的 程序 ， 那 么 就 存在 可 以 执行 相同 任务 的 图 灵机 
(并 且 任 何 通用 图 灵机 也 可 以 执行 此 操作 )。 

编程 语言 。 几 乎 目前 使 用 的 所 有 编程 语言 都 是 图 灵 完 备 模 型 包括 过 程 编 程 语言 (如 
C、Fortran 和 Basic)、 面 向 对 象 的 编程 语言 (如 Java 和 Smalltalk)、 函 数 式 编程 语言 (如 
Lisp 和 Haskell)、 多 范式 语言 (如 C ++ 和 Python)、 专 用 语言 (如 Matlab 和 R) 和 逻辑 编程 
语言 (如 Prolog)。 虽 然 有 些 编程 语言 似乎 比 其 他 编程 语言 更 强大 ， 但 它们 的 核心 都 是 等 效 
的 (就 它们 可 以 实现 哪些 计算 函数 以 及 它们 可 以 判定 哪些 语言 而 言 ， 是 等 效 的 )。 编 程 语言 
在 其 他 重要 特性 〈 如 可 维护 性 、 可 移植 性 、 可 用 性 、 可 靠 性 和 效率 ) 方面 会 有 所 不 同 ， 因 此 
我 们 选择 语言 时 是 基于 方便 性 和 效率 ， 而 非 能 力 。 

字符 串 替 换 系 统 。 许 多 模型 涉及 创建 一 组 规则 来 替换 字符 串 集 中 的 子 字 符 串 。 这 样 的 系 
统 可 以 非常 简单 ， 这 可 以 说 明 它 们 的 受 欢 迎 程度 。 我 们 将 在 本 节 末 尾 的 创新 练习 中 查看 此 类 
系统 的 一 些 示 例 。 

DNA 计算 机 。DNA 是 驱动 生物 发 展 进程 的 核心 动力 ， 现 代 分 子 生物 学 已 经 提供 了 对 
DNA 的 离散 变化 的 理解 。1994 年 ， 伦 纳 德 ， 阿 德尔 曼 (Leonard Adelman) 想象 利用 这 些 变 
化 来 实现 计算 并 模拟 图 灵机 。 实 验证 实 了 这 种 方法 的 有 效 性 : 可 以 用 DNA 构建 计算 机 ! 当 
然 ， 一 些 自然 生物 过 程 是 否 以 相同 的 方式 运作 完全 是 另 一 个 问题 。 


模型 描述 
20 世纪 初 
半 图 埃 系统 字符 串 替 换 规则 ， 可 以 按 任意 顺序 使 用 
(Thue, 1910) 
正式 波斯 特 系统 字符 串 替 换 规则 ， 和 旨 在 证 明 来 自 一 组 公理 的 数学 陈述 
(了 Post，1920s ) 
20 世纪 中 
拉 姆 达 演 算 一 种 定义 和 操作 函数 的 方法 
(Church, 1936) ( 函数 编程 语言 的 基础 ， 如 Lisp 和 ML ) 
图 灵机 在 无 限 纸 带 上 读 写 的 有 限 自 动机 
(Turing, 1936) 
波斯 特 机 带 队列 的 图 灵机 
( Post，1936 ) 
递归 滑 数 定义 对 自然 数 计算 的 函数 
(Gadel 等 人 ，1930s ) 
无 限制 文法 用 于 描述 自然 语言 的 字符 串 替 换 规 则 
(Chomsky, 1950) 
2D 元 胞 自动 机 二 值 类 型 的 二 维 数组 ， 每 个 元 素 依据 规定 的 
(von Neumann, 1952) 规则 随 邻 居 值 的 变化 而 变化 
马尔 可 夫 系 统 字符 串 蔡 换 规则 ， 按 预先 指定 的 顺序 使 用 
(Markov, 1960) 


通用 计算 模型 


466 党 5 茧 


。 霍 因子 名 逻辑 ( Hormn，1961) 基于 逻辑 的 定理 证 明 系统 ( Prolog 编程 语言 的 基础 ) 
双 寄 存 器 DFA (Minsky，1961 ) DFA 加 两 个 计数 器 ( 每 个 计数 器 存储 一 个 整数 ， 
机 器 可 以 递增 、 递 减 ， 如 果 为 零 则 测试 ) 
双 栈 图 灵机 ( Shepherson/Sturgis，1963 ) 图 灵机 加 两 个 下 推 栈 
游戏 人 生 ( Conway，1960s ) 特定 的 2D 元 胞 自动 机 
指针 机 有 限 多 个 寄存 器 加 上 按 链 表 访 问 的 内 存 
随机 存 取 机 有 限 多 个 寄存 器 加 上 通过 索引 访问 的 内 存 
20 世纪 末 
编程 语言 Java, C, C++, Python, Matlab, R, 
Fortran, Lisp, Haskell, Basic, Prolog 
Lindenmayer 系统 (Lindenmayer，1976 ) 字符 串 替 换 规则 ， 并 行 应 用 (用 于 模拟 植物 生长 ) 
台球 计算 机 (Fredkin 和 Toffolis 1982 ) 难以 区 分 的 台球 在 平面 内 移动 ， 相 互 之 间 
产生 弹性 碰撞 和 内 部 障碍 
粒子 计算 机 粒子 通过 空间 传递 信息 ( 当 粒 子 碰撞 时 发 生计 算 ) 
1D 元 胞 自动 机 (Cook，1983 ) 二 值 类 型 的 向 量 ， 根 据 特定 规则 改变 ， 取 决 于 其 邻居 的 值 
量子 计算 机 【Deutsch，1985 ) 通过 量子 态 的 县 加 计算 
(基于 Feynman 在 20 世纪 50 年 代 的 工作 ) 
广义 移 位 图 ( Moore，1990 ) 单个 经 典 粒子 在 由 抛物 面 镜 制 成 的 三 维 势 阱 中 移动 
DNA 计算 机 ( Adelman，1994 ) 通过 DNA 链 的 生物 操作 进行 计算 
通用 计算 模型 ( 续 ) 


对 普遍 性 概念 的 了 解 导致 了 观点 的 戏剧 性 转变 。 似 乎 我 们 在 自然 界 中 观察 到 的 任何 类 似 
于 计算 机 的 东西 实际 上 都 是 计算 机 。 尽 管 已 经 进行 了 数 十 年 的 尝试 , 但 自 图 灵 以 来 开发 出 来 
的 每 一 个 至 少 与 图 灵机 一 样 强大 (可 以 模拟 图 灵机 )、 合理 的 计算 模型 ， 也 被 证 明 没有 图 灵 
机 强大 (因为 它 可 以 用 图 灵机 模拟 )。 

这 种 知识 很 重要 ， 因 为 我 们 可 以 使 用 像 这 样 简单 的 图 灵机 作为 证 明 计 算 事 实 的 通用 模 
型 。 可 以 用 完全 数学 严谨 性 证 明 图 灵机 ， 使 得 我 们 也 可 以 证 明 我 们 经 常 使 用 的 计算 机 。 这 是 
计算 机 理论 中 最 重要 的 一 点 ， 下 一 节 ， 我 们 从 这 一 点 开始 讲解 。 关 于 图 灵机 的 知识 是 否 也 适 
用 于 自然 世界 本 身 的 问题 是 一 个 哲学 问题 ， 值 得 深思 。 
问答 环节 

问 : 真 的 有 可 能 建立 一 个 模拟 传统 计算 机 的 图 灵机 ， 让 它 就 像 我 的 笔记 本 计算 机 中 的 微 
处 理 器 一 样 工作 吗 ? 

答 : 是 的 。 这 正 是 印 奇 -图 灵 论 题 所 说 的 。 明 斯 基 的 经 典 著作 就 描绘 了 这 种 图 灵机 的 
蓝图 。 

问 : 图 灵机 模型 是 不 是 比 真正 的 计算 机 更 强大 ， 因 为 图 灵机 有 无 限 的 纸 带 ， 而 真正 的 
计算 机 只 有 有 限 内 存 ? 

答 : 从 技术 意义 上 讲 ， 是 的 。 可 以 使 用 一 个 庞大 的 DFA 模拟 真实 计算 机 。 但 是 ， 这 个 
DFA 需要 有 至 少 2 "oo 个 状态 才能 为 具有 1GB 内 存 的 计算 机 建 模 ! 虽然 真正 的 计算 机 
只 能 访问 有 限 的 内 存 ， 但 实际 上 ， 如 果 把 互联 网 也 算 在 内 的 话 ， 则 该 数量 几乎 是 无 限 的 。 同 
样 ， 如 果 你 认为 宇宙 中 可 访问 的 数据 位 数 是 有 上 限 的 ， 那 么 你 必须 承认 图 灵机 是 纯粹 虚构 的 
模型 ， 是 无 法 实现 的 。 

问 : 图 灵机 能 模拟 每 种 类 型 的 计算 吗 ? 

答 : 图 灵机 专 为 判定 语言 和 计算 函数 而 设计 ， 对 于 其 他 一 些 类 型 的 计算 不 一 定 能 很 好 
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地 完成 。 例 如 ， 生 成 随机 数 、 控 制 自动 驾驶 汽车 或 制作 蛋 奶 酥 。 要 对 这 些 类 型 的 计算 进行 建 
模 ， 你 需要 将 图 灵机 连接 到 合适 的 外 围 设备 。 

问 : 为 什么 不 设计 一 台 比 图 灵机 更 强大 的 机 器 呢 ? 

答 : 人 们 已 经 这 样 做 了 。 理论 上 说 ， 超 级 通用 计算 设备 是 一 种 功能 更 加 强大 的 抽象 模 
型 ， 能 够 计算 图 灵机 所 不 能 计算 的 任务 。 实 现 这 种 模型 的 一 种 方法 是 存储 连续 值 而 不 是 离散 
的 符号 。 然 而 ， 我 们 无 法 确定 : 自然 界 中 是 否 存在 连续 值 ? 如 果 存 在 的 话 ， 自 然 界 中 是 如 何 
处 理 这 些 连 续 值 的 ? 


创新 练习 
5.3.1 通用 虚拟 DFA (表示 形式 ) 。 开 发 一 个 适用 于 图 灵机 纸 带 的 DFA 表示 。 
答案 : 从 DFA 输入 开始 ， 然 后 是 一 个 四 行 的 状态 表 ( 表 头 占据 了 一 行 )， 分 别 标记 为 符号 A (对 
于 状态 0 )、B (对 于 状态 1) 和 C (对 于 状态 2 )， 每 行 后 跟 两 个 数字 ( 0,1 或 2 ) 给 出 两 个 可 能 
的 DFA 输入 符号 的 下 一 个 状态 。 在 状态 表 之 后 是 标记 符号 Z， 后 跟 三 个 符号 ， 用 于 为 每 个 状态 
指定 操作 ， 它 们 的 值 是 Y 或 N。 
个 状态 


MX 


< 一 bo- 
1 N 12 


2 ”机 20 


DFA 输 入 迁移 操作 
I[#|b|alblblalolilelil2lcl2|olz[Y [vIn 


状态 0 ”状态 1 状态 2 操作 标记 
的 标记 的 标记 的 标记 


5.3.2 ”通用 虚拟 DFA。 开 发 一 个 图 灵机 ， 可 以 模拟 任何 给 定 的 三 态 DFA 在 任意 给 定 输入 上 的 操作 。 


答案 : 
1 
ES ri 5 
b:X 
从 5 和 访 3 R -0—> L -X:#—> 到 0 
1 a:X ~ -yy 4 \ 
区 R 一 人 一 R E 
+ 2 
到 20 3 
6 po es 11 
从 11 一 R 二 R-1 L 一 X:# = 到 6 
1 a:X ~、 :yy 4 
Z 一 B 一 > 2 
到 19 让 


一 元 /: 
5 仁之 my 17 
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要 了 解 此 图 灵机 的 运行 方式 ， 请 考虑 前 
六 个 状态 ， 如 右 图 所 示 。 这 些 状态 对 应 
于 DFA 状态 0 (每 个 DFA 状态 有 六 个 类 
似 的 状态 )。 
。 状态 0 向 右 扫描 寻找 DFA 输入 符号 ， 
如 果 没 有 这 样 的 符号 ， 那 么 就 会 扫描 到 20 到 17 
到 标记 Z。 
。 状态 1 和 2 扫描 寻找 标记 A; 它们 之 后 是 DFA 状态 0 的 迁移 。 如 果 输 入 符号 是 b， 则 状态 3 将 
跳 过 下 一 个 符号 。 
。 状态 4 将 会 发 生 状态 迁移 ， 迁 移 到 与 状态 5， 或 者 是 与 DFA 状态 1 和 2 对 应 的 机 器 中 的 状态 
(11 和 17)。 
。 状态 5 向 左 扫描 到 输入 的 最 左 端 ， 准 备 读 取 下 一 个 符号 。 
当 遇 到 Z 标记 时 ， 表 示 DFA 输入 已 读 完 ， 状 态 20 读 取 状 态 0 的 动作 并 选择 进入 Y 或 NN 状态 。 
对 应 于 DFA 状态 1 和 2 的 图 灵机 部 分 与 对 应 于 DFA 状态 的 六 个 状态 相同 ， 只 是 它们 还 可 以 分 
别 扫描 B 和 C 标记 ， 以 在 状态 表 中 找到 它们 的 行 ， 并 且 它 们 在 状态 19 和 18 中 分 别 扫描 到 Z 标 
记 之 后 会 跳 到 相应 的 正确 状态 。 请 注意 ， 此 图 灵机 没有 H 状态 ， 并 且 不 会 以 无 限 循环 结束 ， 因 
为 每 个 DFA 都 会 要 么 接受 要 么 拒绝 其 输入 字符 串 。 因 此 ， 对 于 任何 DFA 和 任何 输入 字符 串 ， 
这 个 图 灵机 可 以 判定 给 定 的 DFA 是 否 接受 给 定 的 输入 。 
通用 虚拟 DFA (跟踪 )。 对 于 练习 5.3.2 中 的 图 灵机 ,假设 DFA 用 于 描述 b 的 数量 是 3 的 倍数 的 
语言 ( 见 练习 5.3.1 )， 输 入 为 babb， 请 给 出 图 灵机 的 追踪 。 并 解释 如 果 输 入 扩展 成 babbb， 跟 
踪 的 信息 会 是 什么 样 的 。 
部 分 答案 : 如 下 。 





从 状态 0 开始 


n 
Ny 
局 
N 
< 
忆 3 
=z 
站 


babbAaAoile1?2 


划 二 Ai 0 二 8B 让 2 G2 全 ZY- 站 详 0-2 ”和 问 右 扫描 到 b 
1 浊 训 本 2-3 ” 问 右 扫描 到 A 
Fab b AOBl1i2 C202YYN 3-4 ” 跳 过 

# ab b A 1 2 chr0 ZY YN 4-11 ”到 达 DFA 的 状态 1 
和 了 11-6 ”向 左 扫描 直到 # 
###[lb Ao0lB12C20ZYYN# 6-7- 问 右 扫描 直到 a 
### bb AD 1 FIN2Cc20ZYYN# 7-10 ” 和 癌 右 扫描 直到 B 
a bb A CC 20ZYYN 二 10-11 ”到 达 DFA 的 状态 1 
###]bAo0olB12CcC207ZY YN# 11-6 ”向 左 扫描 直到 # 
# 着 ## 了 EB]AO 1B12cC20ZzZYYN# 6-8 ”向 右 扫描 直到 b 
大 是 江 关 .DA 0 下 生 二 1 2 WZ YY 村 潍 8-9 ”向 右 扫描 直到 B 
20 YN 9-10 ” 跳 过 

# ###bAO0liazc2ozvyYynN# 10-17 到达 DFA 的 状态 
### #0A0oGlB1i2cC20ZYYN# 17-=12 ” 回 左 扫描 直到 # 
A 0 L207 YY JR 12-14 ” 问 右 扫描 直到 b 
Ww NM TT 2 CHBND 2 YY YN 14-15 ”向 者 扫描 直到 C 
#0 1 8 TILE 15-16 ” 跳 过 
######A0TlB12 CEIozYYn# 16-5 ”到 达 DFA 状 态 0 
da sO 2 C20zYYN# 5-0 ” 问 左 扫描 直到 # 
#####A01l1B12c202zIrn# 0-20 ”向 右 扫描 直到 Z 
# 着 # 省 AOLIBELI2C20ZIYv N # 0-20 ”在 状态 22 时 接受 


5.3.4 


ee 
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通用 虚拟 DFA (模拟 )。 创 建 一 个 文本 文件 ， 以 图 表 形 式 描述 练习 5.3.2 中 的 通用 DFA 图 灵机 。 
从 本 书 网 站 下 载 TuringMachine.java 和 Tape.java， 按 照 练习 5.2.7 和 练习 5.2.8 中 的 描述 进行 修 
改 ， 以 指定 的 输入 运行 图 灵机 得 到 一 个 跟踪 信息 ， 检 查 练习 5.3.3 的 答案 对 不 对 。 

受 限 制 的 图 灵机 。 纸 带头 只 能 在 一 个 方向 上 移动 的 图 灵机 不 是 通用 的 ， 指 出 一 种 不 被 该 机 器 识 
别 的 语言 来 证 明 如 上 所 述 。 

半 图 埃 系统 。 请 考虑 以 下 字符 串 替换 规则 集 : 

鞍 1 人 2 民 


aa ->b 
ab -> abc 


假设 可 以 任何 顺序 应 用 这 些 蔡 换 规则 ， 一 次 只 能 应 用 一 个 ， 以 达到 将 一 个 字符 串 转 换 为 男 一 个 
字符 串 的 目的 。 那 么 ， 是否 有 可 能 将 aababca 变 成 bbccbcc ? 
答案 : 可 以 ，aababca -> aabcabca -> bbcabca -> bbccbca -> bbccbcc。 


图 埃 系统 。 请 考虑 以 下 字符 串 替 换 规则 集 : 
ac <-> ca 
ad <-> da 
bc <-> cb 
bd <-> db 
eca <-> Ce 
edb <-> de 


cdca <-> cdcae 
aaa <-> aaa 
daa <-> aaa 


与 半 图 埃 系统 类 似 ， 可 以 任何 顺序 使 用 上 述 规则 ， 一 次 应 用 一 个 ， 只 是 这 次 的 规则 是 对 称 的 ， 
可 以 在 任 一 方向 上 应 用 ， 目 标 仍然 是 将 一 个 字符 串 转换 为 另 一 个 字符 串 。 那 么 ， 是 否 有 可 能 将 
abcaccddaa 转换 为 aaa ? 

马尔 可 夫 系 统 。 在 马尔 可 夫 系 统 中 ， 以 字符 串 开始 ， 运 用 字符 串 替代 规则 ， 直 到 再 无 规则 可 
用 。 当 最 后 结果 为 1 时， 原始 字符 串 可 以 接受 ; 否则 拒绝 。 例 如 如 下 马尔 科 夫 系统 : 


ab -> 1 
alb -> 工 


字符 串 aaabbb 被 此 系统 接受 ， 因 为 我 们 可 以 应 用 第 一 个 规则 来 获取 aalbb， 然 后 应 用 第 二 个 规 
则 两 次 得 到 1。 相 反 ，aabbabb 被 拒绝 ， 因 为 在 应 用 第 一 个 规则 两 次 之 后 我 们 将 获得 alblb， 然 
后 是 第 二 个 规则 ， 给 了 11b， 我们 被 卡 住 了 。 设 计 马 尔 可 夫 系 统 ， 识 别 字母 表 {a，b} 组 成 的 所 
有 回 文 序列 。 

波斯 特 系统 。 给 定 由 变量 〈 大 写字 母 ) 和 符号 (其 他 符号 ) 组 成 的 公理 和 替换 规则 列表 ， 不 确定 
地 应 用 替换 规则 以 获取 字符 串 。 例 如 ， 从 公理 1 + 1 = 11 和 替换 规则 开始 。 


X+Y=Z -> X1+Y=Z1 
X+Y=Z -> X+Y1=Z1 


你 可 以 连续 三 次 应 用 第 一 条 规则 得 到 1111 + 1 = 11111， 然 后 连续 两 次 应 用 第 二 条 规则 得 到 
1111 + 111 = 1111111， 然 后 再 次 应 用 第 一 条 规则 得 到 11111 + 111 = 11111111。 描 述 此 波斯 特 系 
统 生成 的 语言 。 


5.3.10 ”匹配 的 括号 。 设 计 一 个 波斯 特 系统 ， 生 成 所 有 完整 匹配 的 括号 字符 串 ， 如 0、00、(00)、(((0 


全 


(0)))) 等 。 

Lindenmayer 系统 。Lindenmayer 系统 ( 工 系统 ) 的 工作 原理 是 从 一 个 初始 字符 串 开 始 ， 然 
后 并 行 应 用 替换 规则 。 比 如 规则 是 用 FLFRRFLF 替换 所 有 出 现 的 FE， 如 果 初 始 字符 串 是 
FRRFRRF ， 则 在 一 次 迭代 之 后 我 们 得 到 FLFRRFLFRRFLFRRFLFRRFLFRRFLF。 
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使 用 这 些 规 则 开发 一 个 Turtle (程序 3.2.4) 的 客户 程序 ， 用 来 绘制 科 赫 曲线 (参见 3.2 节 )。 
将 解释 为 向 前 画 一 条 线 ,L 向 逆 时 针 旋 转 60°%，R 向 顺 时 针 旋 转 60°。 然 后 ,第 nn 次 迭代 之 
后 的 字符 串 是 一 个 n 阶 的 科 赫 曲线 。 编 写 一 个 Java 程序 Lindenmayer， 它 接受 命令 行 参数 n 
并 打印 生成 n 阶 的 科 赫 曲线 的 指令 。 提 示 : 使 用 方法 String.replaceAll()。 

方形 科 赫 曲线 。 使 用 上 述 9 Lindenmayer 系统 产生 方形 科 赫 曲线 : 从 字符 串 F 开始 ， 然 后 用 
FLFRFRFFLFLFRF 不 断 地 替换 所 有 出 现 的 F。 

Bracketet L 系统 。 假 设 一 个 Lindenmayer 系统， 以 字符 F 开 头 并 重复 用 FFR [RFLFLF] L 
[LFRFRF] 并 行 替 换 F。 将 L 和 RR 解释 为 22° 旋转， 将 符号 “[” 和 “]” 解 释 为 向 栈 中 压 人 或 
弹出 海 包 的 当前 状态 (位置 和 角度 )。 括 号 避免 了 图 片 由 单线 组 成 的 情况 。 

项 尔 伯 特 曲线 。 使 用 以 下 L 系统 创建 希 尔 伯 特 曲线 ; 从 字符 A 开始 ， 然 后 不 断 地 用 字符 串 
LBFRAFARFBL 替换 A、 用 字符 串 RAFLBFBLFAR 替换 B。 同 时 应 用 这 两 个 替换 规则 。 第 一 
次 迭代 结果 为 LBFRAFARFBL， 第 二 次 结果 为 : 
LRAFLBFBLFARFRLBFRAFARFBLFLBFRAFARFBLRFRAFLBFBLFARL 

当 使 用 海龟 绘图 显示 曲线 时 ， 将 工 解 释 为 “向 左 转 90"”,， 将 及 解释 为 “向 右 转 90""”， 将 上 解 
释 为 “向 前 移动 "， 忽略 A 和 B。 

龙 形 曲线 。 使 用 以 下 工 系 统 创 建 龙 形 曲线 (参见 练习 1.2.35 ) : 以 字符 串 FA 开始 。 然 后 反复 用 
ALBFL 替换 A、 用 RFARB 替换 B。 如 练习 5.3.14 所 述 ， 将 字母 解释 为 海龟 绘图 的 指令 。 和 忽略 


“A 和 B， 前 3 次 迭代 的 结果 分 别 是 FLFL、FLFLLRFRFL 和 FLFLLRFRFLLRFLFLRRFRFL，。 
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标签 系统 。 编 写 一 个 程序 ， 读 取 二 进 制 字符 串 并 应 用 以 下 〈00,1101 ) 标记 系统 : 如 果 第 一 位 
为 0， 则 删除 前 3 位 并 在 尾部 追加 00 ; 如 果 第 一 位 为 1， 则 删除 前 3 位 并 在 尾部 追加 1101。 
只 要 该 字符 串 不 少 于 3 位 ， 就 不 断 重复 上 述 过 程 。 尝 试 确定 以 下 输入 是 停止 还 是 进入 无 限 循 
环 : 10010,1100100100100100100。 考 虑 使 用 队列 。 

波斯 特 机 。 假 设 标签 系统 是 通用 的 ， 通 过 描述 如 何 使 用 波斯 特 机 模拟 任何 标签 系统 ， 以 此 来 
证 明 波斯 特 机 ( 带 队列 的 DFA) 也 是 通用 的 。 

双 栈 DFA。 假 设 波 斯 特 机 是 通用 的 ， 通 过 描述 如 何 模拟 具有 两 个 栈 的 队列 来 显示 具有 两 个 栈 
的 DFA 也 是 通用 的 。 

合成 滑翔 机 。 初 始 化 康 威 的 生命 的 游戏 (参见 练习 2.4.20 ) 为 一 个 50 x 50 网 格 ， 下 图 显示 的 
是 网 格 的 左上 角 。 这 种 模式 被 称 为 滑翔 机 枪 ( glider gun)， 它 可 以 产生 新 的 滑翔 机 。 它 是 由 R. 
Gosper 在 1970 年 发 明 的 ， 这 是 一 种 可 以 无 限 增长 的 模式 ， 这 个 发 明 赢 得 了 康 威 的 挑战 赛 ( 康 
威 曾 推测 ， 没 有 任何 图 案 能 够 无 止境 地 生长 。 他 曾 拿 出 50 美元 作为 奖品 ， 奖 励 第 一 个 能 够 在 
那 年 证 明 这 个 命题 或 者 将 其 证 伪 的 人 一 一 译 者 注 )。 你 可 以 认为 滑翔 机 生成 器 正在 传输 某 种 信 
息 。 它 被 Paul Rendell 在 2011 年 用 作 实 现 通用 图 灵机 模拟 器 的 基本 构建 块 之 一 。 





原文 错误 。 一 一 译 者 注 
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5.4 可 计算 性 

现在 我 们 已 经 对 算法 是 什么 有 了 一 个 清楚 的 认识 算法 就 是 图 灵机 。 我 们 可 以 通 
过 对 图 灵机 的 证 明 来 探究 计算 的 本 质 。 邱 奇 - 图 灵 论 题 告 诉 我 们 ， 当 我 们 有 任意 一 种 可 
用 的 计算 设备 ， 且 在 这 个 设备 上 能 够 有 一 个 有 限 的 、 确 定 的 且 有 效 的 方法 能 够 解决 某 个 
问题 ， 我 们 就 期 望 能 够 构建 一 个 图 灵机 来 解决 这 个 问题 。 该 论点 反 其 道 而 行 之 更 为 成 立 : 
如 果 我 们 能 够 证 明 判 定 一 种 语言 或 者 计算 函数 的 图 灵机 不 存在 ， 那 么 我 们 便 认 为 这 个 任 
务 在 物理 上 是 不 可 执行 的 。 图 灵 论 文 的 中 心 焦点 是 如 何在 图 灵机 可 以 解决 的 问题 和 图 灵 
机 不 能 解决 的 问题 中 划分 出 一 条 清晰 的 界限 。 在 本 节 中 ,我们 将 介绍 图 灵机 模型 中 一 个 非 
常 重要 的 结论 : 这 个 结论 可 以 用 来 证 明 不 可 判定 的 语言 和 不 可 计算 的 函数 是 存在 的 一 一 在 
这 种 情况 下 ， 不 存在 能 完成 这 些 工 作 的 图 灵机 。 我 们 将 这 些 问题 称 为 不 可 解 问题 ， 因 为 我 
们 认为 无 论 是 现在 还 是 将 来 都 不 存在 可 以 完成 这 些 工 作 的 图 灵机 ， 即 没有 解决 这 些 问题 的 
算法 。 

不 可 解 性 是 问题 的 一 个 重要 特性 。 它 表明 的 不 是 对 于 这 个 问题 的 算法 科学 家 们 尚未 找到 
解决 方案 ， 而 是 不 可 能 找到 。 了 解 问题 的 不 可 解 性 是 很 重要 的 ， 因 为 这 能 让 你 知道 你 试图 解 
决 的 是 一 个 无 法 解决 的 问题 ， 这 样 你 就 可 以 避免 浪费 时 间 和 精力 来 解决 它 ， 转 而 解决 更 容易 
解决 的 问题 。 在 过 去 的 一 个 世纪 里 ， 很 多 人 都 为 解决 某 些 问题 努力 工作 ， 但 这 些 问 题 在 后 来 
都 被 证 明 是 不 可 解 的 。 那 些 不 了 解 图 灵 理 论 的 人 就 像 在 黑暗 中 工作 ， 他 们 有 可 能 会 浪费 大 量 
的 精力 来 完成 不 可 能 完成 的 任务 。 

背景 : 希 尔 伯 特 计划 ”20 世纪 初期 ， 当 时 杰出 的 数学 家 大 卫 … 希 尔 伯 特 提 出 了 一 个 雄 
心 勃 勃 的 计划 ， 这 个 计划 的 目的 是 为 了 解决 巡 辑 和 数学 中 的 一 些 最 基本 的 问题 。 他 和 他 的 同 
事 挑战 了 一 个 难题 ， 对 下 列 三 个 陈述 进行 严格 证 明 : 

。 数学 是 一 致 的 ; 不 可 能 同时 证 明 一 个 陈述 和 它 的 反 论 ， 就 像 你 不 能 证 明 1=2。 

。 数学 是 完备 的 : 如 果 一 个 数学 陈述 是 真 的 ， 那么 就 可 以 证 明 它 是 真 的 。 

。 数学 是 可 确定 的 : 对 于 任何 数学 定理 ， 都 可 以 用 公理 逐步 推导 进行 证 明 。 

这 个 计划 在 20 世纪 中 最 重大 的 进展 发 生 在 1930 年 ， 当 时 库 尔 特 : 哥 德 尔 (KurtG6del) 
以 最 令 人 惊讶 的 方式 解答 了 前 两 个 陈述 : 他 证 明了 任何 公理 系统 (能 够 对 算术 建 模 ) 都 不 可 
能 是 既 一 致 又 完备 的 。 这 个 发 现 动 授 了 整个 学 术 界 的 基础 ， 将 人 们 长 期 以 来 相信 的 东西 置 于 
混乱 之 中 ， 并 使 得 人 们 开始 对 基础 数学 进行 广泛 的 研究 。 

究竟 怎样 才能 算是 一 个 “逐步 推导 的 过 程 ” 呢 ? 究竟 什么 是 “数学 定理 ” 呢 ?“ 数 学 ” 
本 身 又 是 什么 呢 ? 图 灵机 成 功 地 解决 了 这 些 问 题 中 的 第 一 个 ， 并 为 硕 尔 伯 特 计划 的 最 终 解 决 
方案 商定 了 基础 : 数学 不 可 能 是 既 一 致 又 完备 的 ， 并 且 也 是 不 确定 的 ， 因 为 存在 无 法 证 明 的 
定理 。 在 本 节 中 ,我 们 将 在 计算 问题 的 范畴 中 研究 这 些 概 念 。 

示例 : 说 谎 者 悖 论 作为 示例 ， 我 们 来 研究 一 下 说 谎 者 悖 论 (liar"s paradox)， 这 个 悖 论 
可 以 追溯 到 古 希 腊 的 哲学 家 。 假 设 我 们 的 目标 是 将 所 有 命题 分 类 为 真 或 假 ， 例 如 ， 我 们 将 陈 
述 “ 二 加 三 等 于 四 ”和 “地 球 有 一 个 月 亮 ” 分 类 为 真 ， 将 陈述 “二 加 二 等 于 五 ”和 “地 球 有 
两 个 月 亮 ” 分 类 为 假 。 这 似乎 是 个 合理 的 目标 , 但 是 当 我 们 对 以 下 命题 进行 分 类 时 会 遇 到 不 
可 逾越 的 障碍 :“ 这 个 陈述 是 假 的 。” 如 果 我 们 将 它 分 类 为 真 ， 那 么 “这 个 陈述 是 假 的 ”就 是 
假 ， 所 以 我 们 需要 将 它 分 类 为 假 。 如 果 我 们 将 它 分 类 为 假 ， 那 么 “这 个 陈述 是 假 的 ”就 是 
真 ， 所 以 我 们 需要 将 它 分 类 为 真 。 任 何 一 种 情况 都 会 导致 矛盾 。 
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所 有 真 命题 的 列表 所 有 假 命题 的 列表 


| 地 球 上 有 两 个 月 亮 | 
[= 等 到 













一 一 一 


| ”站 把 手 有 脑子 ] 





如 果 是 真 的 ， 那 么 [一 如 果 是 假 的 ， 那么 
这 个 命题 是 假 的 ， 应 一 -| | 。 这 个 命题 是 假 的 ”| | | | “这 个 命题 是 假 的 ”| | -一 这 个 命题 是 真 的 ， 应 
该 属于 另 一 列表 ee i 该 属于 另 一 列表 


说 谎 者 悖 论 

摆脱 这 种 自 相 矛盾 的 唯一 方式 是 承认 原本 的 前 提 一 定 是 假 的 。 这 种 证 明 技 巧 被 称 为 反 证 
法 : 如 果 一 个 假设 最 终 推出 来 的 是 一 个 荒 雇 的 结论 ， 那 么 这 个 假设 一 定 是 假 的 。 在 说 谎 者 悖 
论 的 例子 中 ,我们 的 假设 是 可 以 将 所 有 命题 都 归 类 为 真 或 假 。 而 “这 个 命题 是 假 的 ”这 个 命 
题 ， 无 论 将 它 归 为 哪 一 类 ， 最 后 都 会 产生 矛盾 ， 所 以 我 们 最 开始 的 假设 一 定 是 假 的 。 换 名 话 
说 ， 不 可 能 把 所 有 的 命题 都 分 类 为 真 或 假 。 起 初 这 个 结论 被 当成 一 个 微不足道 的 论点 ， 但 是 
实际 上 这 个 结论 有 着 重大 意义 ， 这 样 的 论点 可 以 作为 证 明 其 他 有 趣事 实 的 基础 。 

注意 这 不 仅仅 是 一 个 数学 不 一 致 的 例子 ， 也 不 仅仅 是 一 个 悖 论 ， 这 个 证 明确 立 了 数学 学 
科 中 的 一 个 事实 ; 不 可 证 明 的 问题 是 存在 的 。 

停机 问题 “依据 图 灵 论 文 ， 下 面 我 们 证 明 停 机 问题 是 无 法 解决 的 ， 通 过 这 个 证 明 我 们 可 
以 证 明 存在 一 个 无 法 解决 的 问题 。 停 机 问题 非 正式 地 描述 为 : 给 定 一 个 程序 和 它 的 输入 ， 确 
定 这 个 程序 在 给 定 输入 上 运行 时 是 否 会 停机 。 由 于 现在 的 计算 机 在 实际 中 并 不 会 经 常 进 入 
停机 状态 ， 所 以 “停机 ”这 个 术语 在 这 里 指 代 程 序 不 会 进入 无 限 循环 。 例 如 ， 我 们 考虑 一 个 
Java 函数 ， 当 这 个 Java 函数 将 控制 权 返 回 给 调用 者 ， 而 不 是 进入 无 限 循 环 时 ， 我 们 认为 这 
个 Java 函数 “停机 ”了 。 

由 于 所 有 的 程序 员 都 体验 过 程序 进入 无 限 循环 带 来 的 不 良 影响 ， 所 以 在 程序 运行 前 检 
查 是 否 会 发 生 无 限 循 环 是 非常 有 必要 的 。 这 也 是 判断 初学 者 编写 的 程序 质量 如 何 的 重要 依据 
之 一 。 再 举 一 个 例子 ， 我 们 思考 一 下 软件 公司 的 质量 控制 部 门面 临 的 挑战 : 这 些 公司 都 希望 
能 证 明 它 们 的 软件 不 会 导致 你 的 移动 设备 无 故 死机 。 我 们 希望 有 一 个 程序 可 以 检查 在 给 定 输 
从 上 和 运行 的 程序 是 否 会 进入 无 限 循环 ， 但 是 图 灵 的 证 明 告 诉 我 们 : 开发 这 样 一 个 程序 是 不 可 
能 的 。 

假设 UTM 是 一 个 将 图 灵机 和 图 灵机 的 输入 作为 输入 的 程序 ， 这 个 程序 可 以 模拟 该 图 灵 
机 的 操作 。 停 机 问题 实际 上 是 询问 是 否 有 这 么 一 个 TM， 这 个 TM 执行 了 一 个 看 起 来 很 简单 
的 任务 ， 即 确定 给 定 的 TM 是 否 会 在 指定 的 输入 上 进入 停机 状态 。 

Java 的 公式 化 证 明 。 对 于 所 有 的 问题 形式 ， 我 们 都 可 以 用 Java 来 重新 表示 停机 问题 。 
虽然 依据 图 灵机 的 定义 来 重新 表述 相关 证 明 过 程 也 不 难 ， 但 是 对 于 具有 编程 经 验 的 人 来 说 ， 
Java 表达 式 更 为 直观 。 所 以 我 们 将 停机 问题 表示 如 下 : 是 否 存在 一 个 表达 式 halts(f x)， 这 
个 表达 式 以 函数 f 和 输入 x 作为 参数 (二 者 都 编码 为 字符 串 )， 能 够 确定 调用 f(x) 是 否 陷 入 无 
限 循 环 。 特 别 的 ，halts(f, x) 必须 具有 以 下 形式 : 
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public static boolean halts(String f, String x) 
{ 


if (《 /* 一 些 极其 聪明 的 判断 */ ) return true; 
else return false; 


} 

为 了 解决 停机 问题 ，halts() 本 身 不 能 进入 无 限 循环 ， 而 且 它 必须 为 每 个 函数 f (这 个 函 
数 只 有 一 个 String 参数 ) 和 每 个 输入 x 提供 正确 的 答案 。 

与 UTM 一 样 ， 你 可 以 将 Java 视 为 一 个 程序 ， 它 将 你 的 程序 及 其 输入 《编码 为 字符 串 ) 
作为 它 的 两 个 参数 ， 然 后 运行 你 的 程序 来 产生 期 望 的 计算 结果 。 是 否 有 这 人 么 一 个 简单 的 程 
序 ， 这 个 程序 同样 需要 相同 的 两 个 参数 ， 就 能 够 确定 是 否 会 陷入 无 限 循环 ? 

一 个 典型 例子 。 为 了 弄 明白 为 什么 这 是 一 个 很 艰巨 的 任务 ,请 你 考虑 以 下 两 个 函数 ， 它 
们 之 间 只 有 一 个 字符 不 同 。 


public static void f(int x) public static void g(int x) 


{ 
while (x != 1) while (x != 1) 
和 if (x % 2 == 0) X=X/ 2; 
else x = 2*x + 1; else x Ss 3*x + 1: 


} 


当 且 仅 当 x 不 是 2 的 正 整数 次 究 时 ， 左 边 的 函数 进入 无 限 循环 ; 而 右边 的 函数 实现 了 我 
们 在 练习 2.3.29 中 遇 到 的 克拉 茨 序列 (Collatz sequence)， 这 个 函数 的 情况 不 太 清 晰 ， 因 为 
没有 人 知道 这 个 函数 是 否 可 以 对 于 任意 的 x 能 够 停机 。 对 于 任何 给 定 的 x， 我 们 需要 等 待 多 
久 才能 判定 它 处 于 一 个 无 限 循环 中 呢 ? 我 们 可 以 运行 一 下 程序 来 看 看 会 发 生 什么 。 如 果 它 一 
直 不 停 地 运行 的 话 ， 我 们 该 怎么 办 呢 ? 也 许 我 们 再 继续 运行 一 会 儿 它 就 会 停机 。 一 般 来 说 ， 
我 们 无 法 确切 地 知道 一 个 程序 会 运行 多 久 。 就 算是 数学 家 已 经 证 明了 在 输入 值 小 于 1022 的 
情况 下 会 终止 ， 但 是 我 们 也 总 会 找到 一 个 更 大 的 值 ， 而 这 个 值 是 否 能 够 停机 还 是 需要 重新 测 
试 ( 见 练习 5.4.7 )。 这 是 一 个 极端 的 例子 ， 但 是 它 强调 了 一 个 事实 ， 这 个 事实 是 判断 一 个 给 
定 的 程序 是 否 会 停机 并 不 是 一 件 简单 的 事 。 一 步 一 步 的 模拟 程序 的 操作 比 确定 一 个 程序 是 否 
会 进入 无 限 循 环 更 容易 。 事 实 上 ， 证明 程序 是 否 会 进入 无 限 循环 是 一 个 不 可 能 完成 的 任务 。 
你 可 能 会 觉得 这 个 结论 难以 接受 ， 接 下 来 我 们 会 证 明 它 。 

证 明 不 可 解 性 。 有 的 问题 是 不 可 解 的 ， 这 可 能 会 粉碎 你 对 于 计算 的 一 些 根深 蒂 固 的 想 
法 。 所 以 我 们 建议 你 多 看 几 次 证 明 过 程 ， 直 到 你 对 这 个 观念 不 再 感到 惊讶 并 坚信 它 是 正确 
的 。 这 是 20 世纪 最 重要 的 思想 之 一 。 
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如 果 你 觉得 这 只 是 一 个 符合 逻辑 的 技巧 ， 请 你 再 次 阅读 这 个 证 明 ， 然 后 尝试 完成 练习 
5.4.7。 停 机 问题 的 不 可 解 性 是 计算 的 一 个 有 重大 意义 的 陈述 ， 具 有 重要 的 实际 意义 。 

归 约 法 “停机 问题 不 仅 非常 有 趣 ， 而 且 它 在 很 大 的 范围 内 都 十 分 重要 ， 因 为 我 们 可 以 用 
它 来 证 明 其 他 重要 问题 是 无 法 解决 的 。 用 于 此 目的 的 技术 被 称 为 归 约 法 (problem reduction ): 






这 是 一 个 简单 的 概念 ， 但 是 在 最 开始 的 地 方 有 点 混乱 ， 因 
为 最 开始 B 的 实例 可 能 有 多 个 。 实 际 上 ， 在 我 们 的 所 有 例子 里 
面 都 只 使 用 了 B 的 一 个 实例 。 而 且 ， 我 们 使 用 的 归 约 是 与 不 可 
解 性 相对 的 。 我 们 首先 把 问题 A 看 作 停机 问题 ， 然 后 证 明 问题 
B 的 一 个 解决 方案 可 以 用 于 解决 停机 问题 。 这 就 意味 着 B 也 是 
不 可 解 的 ， 因 为 停机 问题 是 不 可 能 解决 的 。 

”整体 性 。 我 们 将 要 研究 的 第 一 个 例子 是 整体 性 问题 。 我 们 
是 否 可 以 编写 这 么 一 个 程序 ， 它 将 一 个 函数 作为 输入 ， 并 且 确 定 对 于 任意 输入 它 是 否 会 进入 
无 限 循环 。 例 如 ， 解 决 了 这 个 问题 就 能 解决 前 文中 用 于 表达 克拉 区 猜想 的 g0。 任 何 软件 公 
司 都 希望 有 这 么 一 个 程序 来 证 明 它 的 产品 不 会 进入 无 限 循环 。 但 是 我 们 可 以 用 归 约 法 证 明 这 
个 问题 是 不 可 解 的 。 
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总 之 ,我 们 通过 把 停机 问题 归 约 成 整体 性 问题 ， 从 而 证 明 整 体 性 问题 是 不 可 解 的 。 如 果 
我 们 可 以 解决 整体 性 问题 ， 那 么 我 们 就 可 以 解决 停机 问题 。 由 于 停机 问题 是 不 可 解 的 ， 所 以 
整体 性 问题 也 是 不 可 解 的 。 | 

将 问题 A 看 作 任意 不 可 解 的 问题 ,这 样 的 论述 同样 奏效 。 通 过 仔细 研究 这 个 例子 和 下 
一 小 节 中 的 例子 ， 你 能 更 好 地 感受 这 个 证 明 过 程 。 如 果 你 没有 深入 研究 数学 ， 那 你 最 好 稍微 
浏览 一 下 证 明 的 过 程 ， 并 且 在 第 一 次 阅读 的 时 候 就 尝试 理解 这 个 结论 。 之 后 你 可 能 会 更 加 仔 
细 地 研究 这 个 证 明 ， 因 为 它们 与 典型 的 数学 证 明 相 比 其 实 很 简单 。 

等 价 程 序 。 我 们 是 否 可 以 编写 这 人 么 一 个 程序 ， 这 个 程序 将 两 个 函数 作为 输入 并 确定 这 两 
个 函数 是 否 等 价 ( 即 这 两 个 函数 对 于 给 定 的 输入 会 产生 相同 的 输出 ) ? 同样 的 ， 任 何 软件 公 
司 也 会 想 要 这 样 的 一 个 程序 。 我 们 也 同样 可 以 通过 归 约 法 来 证 明 这 个 问题 是 不 可 解 的 。 






总 之 ， 我 们 通过 把 整体 性 问题 归 约 成 等 价 问 题 ， 从 而 证 明 等 价 问题 是 不 可 解 的 。 如 果 我 
们 能 解决 等 价 问题 ， 就 可 以 解决 整体 性 问题 。 因 为 整体 性 问题 是 不 可 解 的 ， 所 以 等 价 问题 也 
是 不 可 解 的 。 

莱 斯 定理 。 这 些 属性 只 是 冰山 一 角 。 当 一 个 程序 的 任何 输入 /输出 的 行为 属性 是 非 平凡 
的 ， 也 就 是 说 ， 这 些 属 性 是 某 些 程序 具备 而 非 所 有 程序 具备 的 ， 我 们 就 把 这 样 的 属性 称 为 一 
个 程序 的 功能 属性 。 享 利 * 莱 斯 (Henry Rice) 在 1951 年 的 博士 论文 中 证 明了 下 面 的 定理 : 
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这 个 定理 具有 极其 广泛 的 适用 性 。 一 个 Java 程序 可 以 在 标准 输出 上 写 超过 10to 个 符 
号 吗 ? 它 能 输出 什么 吗 ? 它 会 基于 不 只 一 个 参数 值 而 进入 无 限 循 环 吗 ? 如 果 它 所 有 的 参数 都 
是 合法 的 ， 它 会 停机 吗 ? 一 个 没有 参数 的 Java 程序 会 停机 吗 ? 你 可 以 很 轻松 地 添加 几 十 个 
属性 到 这 个 列表 中 。 许 多 听 起 来 很 自然 的 问题 都 与 程序 的 功能 特性 有 关 。 

不 可 解 性 和 莱 斯 定理 从 一 个 非常 实际 的 角度 出 发 ， 为 我 们 理解 “为 什么 确保 软件 系统 
的 可 靠 性 如 此 困难 ”提供 了 基础 。 这 就 像 我 们 想 编写 一 个 程序 来 确保 软件 具有 很 多 我 们 想 要 
的 属性 一 样 ， 这 是 不 可 能 做 到 的 。 了 解 这 个 事实 的 人 会 比 不 了 解 这 个 事实 的 人 在 计算 领域 更 
成 功 。 
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更 多 不 可 解 问题 的 例子 ”不可解 性 不 仅 限于 那些 处 理 程 序 的 程序 (这 些 程序 很 重要 )。 
自从 图 灵 提 出 这 个 概念 以 来 ， 经 过 了 数 十 年 ， 研 究 人 员 一 直 在 用 归 约 法 来 大 量 地 扩展 不 可 解 
问题 的 数量 ， 并 在 数学 、 科 学 和 工程 的 各 个 领域 都 有 应 用 。 某 个 已 知 的 不 可 解 问题 被 归 约 成 
一 个 新 间 题 ， 若 新 问题 可 以 解决 最 终 意 味 着 停机 问题 可 以 解决 ， 所 以 新 的 问题 被 证 明 是 不 可 
解 的 。 我 们 在 后 面 的 表格 中 引用 了 许多 重要 又 有 趣 的 例子 ， 接 下 来 我 们 会 更 详细 地 讨论 其 中 
的 一 些 例 子 。 

邮政 通信 问题 。 下 面 的 问题 涉及 的 内 容 是 一 些 写 在 卡 券 上 的 字符 串 ， 这 些 字符 串 最 早 是 
由 埃 米尔 波斯 特 (Emil Post) 在 1940 年 分 析 的 。 一 个 邮政 通信 系统 就 是 一 个 已 定义 的 卡 
券 类 型 的 集合 。 每 种 类 型 由 两 个 字符 串 修饰 ， 一 个 写 在 卡 券 的 顶部 ， 另 一 个 写 在 卡 券 的 底 
部 。 例 如 ， 右 边 的 示例 展示 了 四 种 卡 券 类 型 ， 第 一 种 顶部 “卡片 类 型 
是 BAB， 底 部 是 A ;第 二 种 顶部 是 A， 底 部 是 ABA, 等 “ff 
等 。 我 们 要 解决 的 问题 是 ， 是 否 可 以 将 卡 券 ( 使 用 任何 数量 EE 
的 每 种 类 型 的 卡 券 ) 排 成 一 列 ， 使 得 顶部 和 底部 的 字符 串 相 2 3 
同 。 在 我 们 的 例子 中 ,答案 是 肯定 的 ， 如 图 下 部 的 解决 方 解决 方 案 
案 所 示 : 一 张 类 型 为 1 的 卡 券 跟着 一 张 类 型 为 3 的 卡 券 ， 四 加 去 
然后 是 一 张 类 型 为 0 的 卡 券 ， 然 后 是 一 张 类 型 为 2 的 卡 券 ， B B 
最 后 是 第 二 个 类 型 为 1 的 卡 券 ， 这 样 顶 部 和 底部 的 字符 串 + 人 i : 
都 是 ABABABABA。 en 

另 一 个 例子 表明 这 并 不 总 是 可 能 完成 的 ， 如 左 图 所 示 。 为 什么 在 这 种 情况 下 没有 解决 方 
案 呢 ? 在 开始 的 时 候 ， 解 决 方案 中 最 左边 的 卡 的 顶部 和 底部 的 最 左 侧 符号 必须 是 一 致 的 ， 但 
是 没有 任何 一 张 卡 的 顶 CR 所 有 没有 方法 能 适当 地 排列 这 些 

一 般 来 说 ， 像 这 么 简单 就 对 例子 进行 解释 的 方式 可 能 不 存在 ， 
QI 
nan 和 et 

。 值 得 注意 的 是 ， 这 个 问题 是 不 可 解 的 。 这 个 问题 被 证 明 可 

另 一 个 部下 通信 x mies 而 这 些 问题 也 是 不 可 解 的 。 

最 优 数据 压缩 。 你 可 能 已 经 尝试 过 使 用 数据 压缩 算法 来 减少 图 片 或 数据 文件 的 大 小 ， 这 
样 可 以 方便 地 共享 或 存储 它 。 你 的 系统 中 使 用 的 算法 是 经 过 几 十 年 研究 的 产物 ,但 是 我 们 很 
自然 会 问 : 是 否 能 将 文件 的 大 小 压缩 得 更 小 。 在 形式 上 ， 这 个 想法 可 以 被 看 作 最 优 数 据 压缩 
(optimal data compression) 问题 : 给 定 一 个 字符 串 ， 找 到 能 够 生成 这 个 字符 串 的 最 短程 序 
(以 字符 数量 来 衡量 )。 例 如 ， 曼 德 布 洛 特集 合 ( Mandelbrot set) 是 一 个 由 简单 程序 生成 复杂 
图 片 的 典型 例子 〈 见 程序 3.2.7 )。 如 果 你 尝试 压缩 系统 上 的 曼 德 布 洛 特集 合 中 的 高 分 辩 率 图 
像 ， 你 可 能 会 取得 一 些 进展 ， 但 是 却 无 法 压缩 到 代表 整个 程序 的 几 百 个 字符 那么 小 。 是 否 有 
能 够 从 图 像 中 推断 出 程序 的 算法 呢 ? 这 个 问题 其 实 是 奥 卡 姆 着 刀 (Occam’s Razor) 问题 的 一 
种 具体 化 表述 一 一 寻找 与 事实 相符 的 最 简单 的 描述 方法 。 虽 然 有 正式 的 方法 来 简洁 地 描述 这 
一 发 现 会 很 不 错 ,， 但 是 这 个 问题 是 不 可 解 的 。 

优化 编译 器 。 在 学 术 界 关于 编程 语言 研究 的 领域 中 ， 最 优 数 据 压 缩 被 称 为 “充分 就 业 
定理 "， 它 表示 没有 一 个 编译 器 可 以 保证 它 有 对 所 有 程序 都 能 够 进行 优化 的 能 力 。 从 莱 斯 定 
理 出 发 我 们 可 以 得 到 一 系列 充分 就 业 定理 ， 很 多 我 们 希望 编译 器 为 我 们 解决 的 问题 实际 上 是 
不 可 解 的 。 例 如 ， 程 序 是 否 有 未 初始 化 的 变量 ? 程序 是 否 有 永远 不 会 执行 的 “ 死 代 码 ”? 改 


太 蔓 理论 477 


变 特定 变量 的 值 和 特定 点 的 值 是 否 会 影响 计算 结果 ? 程序 能 产生 一 个 给 定 的 字符 串 作为 输出 
吗 ? 很 多 像 这 样 的 问题 我 们 都 希望 编译 器 来 帮助 我 们 解决 ， 但 是 它们 做 不 到 。 


问题 描述 
处 理 程 序 的 程序 
停机 问题 一 个 给 定 的 程序 对 于 一 个 给 定 的 输入 是 否 会 进 人 无 限 循环 ? 
整体 性 一 个 给 定 的 程序 对 于 任 一 输入 是 否 会 进入 无 限 循环 ? 
等 价 程序 两 个 程序 是 否 会 得 出 相同 结果 ? 
内 存 管 理 一 个 给 定 的 变量 是 否 会 被 再 次 引用 ? 
病毒 识别 给 定 的 程序 是 不 是 病毒 ? 
功能 属性 一 个 程序 是 否 有 某 个 功能 属性 ? 
其 他 例子 
邮政 通信 问题 一 个 给 定 的 字符 串 替 换 规 则 集合 是 否 有 效 ? 
最 优 数据 压缩 是 否 可 以 对 一 个 给 定 的 字符 串 进行 压缩 ? 
希 尔 伯 特 的 第 十 个 问题 给 定 的 多 元 多 项 式 是 否 有 整数 根 ? 
定 积分 给 定 的 积分 是 否 有 封闭 解 ? 
群 论 一 个 有 有 限 个 表示 的 组 是 简单 的 、 有 限 的 、 自 由 的 还 是 可 交换 的 ? 
动态 系统 一 个 给 定 的 动态 系统 是 混乱 的 吗 ? 
不 可 解 问题 的 例子 


希 尔 伯 特 的 第 十 个 问题 。1900 年 ， 大 卫 : 希 尔 伯 特 在 巴黎 召开 的 国际 数学 家 大 会 上 提出 
了 23 个 问题 ， 作 为 将 要 到 来 的 21 世纪 的 挑战 。 希 尔 伯 特 的 第 十 个 问题 是 设计 一 个 过 程 ， 根据 
这 个 过 程 ， 可 以 通过 有 限 数量 的 操作 来 决定 一 个 给 定 的 多 项 式 (有 多 个 变量 ) 是 否 有 整数 根 。 
换 句 话说 ， 是 否 可 以 将 整数 值 分 配给 多 项 式 的 变量 使 得 多 项 式 的 结果 为 零 。 例 如 ， 多 项 式 
f(x, yz2)=6xyz*+3zy* 一 x’ -10 有 整数 根 ， 因 为 f(5,3,0)=0， 而 多 项 式 f(x,y)=x +y? -3 
没有 任何 整数 根 。 这 个 问题 可 以 追溯 到 两 千年 前 的 丢 番 图 方程 ， 它 出 现在 物理 学 、 计 算 生物 
学 、 运 筹 学 和 统计 学 等 多 个 领域 。 当 时 并 没有 对 算法 进行 严格 的 定义 ， 因 此 没有 考虑 到 不 可 
解 的 问题 。 在 20 世纪 70 年 代 ; 希 尔 伯 特 的 第 十 个 问题 以 非常 令 人 惊讶 的 方式 得 到 了 解决 : 
在 马丁 戴 维 斯 (Martin Davis)、 和 希拉 里 ， 普 特 南 (Hilary Putnam) 和 茱 莉 亚 .罗宾逊 (Julia 
Robinson) 奠定 的 基础 上 ， 尤 里 : 马 季 亚 谢 维 奇 (Yuri Matiyasevich) 证 明了 这 个 问题 是 不 可 
解 的 ， 所 有 应 用 了 这 个 模型 得 出 的 实际 解决 方案 都 是 不 可 解决 的 。 例 如 ， 通 过 对 这 个 问题 进 
行 归 约 ， 很 容易 得 出 旅行 计划 问题 是 不 可 解决 的 ;这 意味 着 针对 航空 公司 发 布 的 航班 和 票 价 
的 数据 ， 不 可 能 找到 一 个 算法 可 以 查询 任意 一 个 旅行 计划 ( 即 指定 起 点 和 终点 的 一 次 飞行 计 
划 ) 的 最 佳 路 线 信 息 (或 者 确定 这 个 路 径 不 存在 )。 

定 积分 。 数 学 家 和 科学 家 现在 都 广泛 地 依赖 计算 机 系统 来 帮助 他 们 进行 符号 化 的 操作 。 
这 些 系统 用 计算 机 来 完成 泰勒 级 数 、 多 项 式 相 乘 、 积 分 和 微分 等 复杂 计算 任务 。 开 发 这 样 的 
计算 机 系统 的 一 个 关键 挑战 是 定 积分 : 是 否 对 于 每 个 定 积 分 都 能 找到 一 个 封闭 解 ， 这 个 封闭 
解 仅 由 多 项 式 和 三 角 函 数 构成 ? 许多 人 为 了 这 个 任务 的 算法 努力 工作 了 很 多 年 ,但 是 现在 已 
经 从 希 尔 伯 特 的 第 十 个 问题 的 归 约 中 知道 这 个 问题 是 不 可 判定 的 。 

启示 ”对 于 计算 原理 理解 不 够 深入 的 人 ， 往往 会 觉得 我 们 可 以 用 一 个 足够 强大 的 计算 机 
做 任何 事情 。 正 如 我 们 在 本 节 的 很 多 例子 中 看 到 的 一 样 ， 这 个 假设 毫 无 疑问 是 错 的 。 不 可 解 
问题 的 存在 对 计算 和 哲学 都 有 着 深远 的 影响 。 这 些 问题 让 我 们 知道 所 有 的 计算 机 都 受到 计算 
方面 的 内 在 限制 。 我 们 必须 认识 到 有 些 问 题 是 不 可 解 的 ， 而 无 论 这 些 问题 多 么 重要 。 
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除了 它 的 实际 重要 性 之 外 ， 不可解 性 (与 印 奇 - 图 灵 理 论 一 起 ) 让 我 们 有 机 会 窥视 自然 办 
的 计算 规律 ， 而 且 它 还 引发 了 一 系列 哲学 问题 。 例 如 ， 如 果 印 奇 - 图 灵 理 论 适用 于 人 脑 ， 那 
么 人 类 将 无 法 解决 像 停 机 那样 的 问题 。 人 类 有 可 能 会 像 计算 机 一 样 有 根本 的 局 限 性 。 有 没有 
哪个 自然 过 程 是 普遍 适用 的 ? 如 果 有 的 话 ， 是 否 有 因为 不 可 解 性 而 不 能 存在 于 自然 界 中 的 条 
件 呢 ?是 否 有 违反 印 奇 - 图 灵 理 论 的 自然 过 程 呢 ? 自从 图 灵 工 作 的 意义 广为人知 后 ， 数 学 家 
和 哲学 家 一 直 在 挑战 这 些 问题 。 人 们 普遍 承认 ， 他 的 论文 是 20 世纪 最 重要 的 科学 论文 之 一 。 


不 知道 不 可 解 性 知道 不 可 解 性 
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问答 环节 

问 : 停机 问题 的 不 确定 性 告诉 我 们 ， 我们 不 能 写 出 一 个 Java 程序 来 确定 一 个 任意 的 程 
序 是 否 在 任意 的 输入 上 停机 。 但 是 我 们 可 以 写 一 个 程序 来 确定 一 个 特定 的 Java 程序 是 否 会 
在 一 个 特定 的 输入 上 停机 吗 ? 

答 : 一 个 从 业者 可 能 会 说 我 们 可 以 写 很 多 这 样 的 程序 ， 它 们 都 确定 会 停机 (如 
HelloWorld.java)。 一 个 理论 家 可 能 会 说 ， 你 可 以 写 两 个 程序 ， 一 个 只 是 会 打印 Yes， 另 一 
个 只 是 会 打印 No， 这 两 个 程序 之 中 肯定 有 一 个 是 正确 的 。 当 然 ， 也 有 可 能 没有 任何 人 知道 
正确 答案 是 什么 , 但 是 这 不 能 证 明 没 有 办 法 找到 答案 ， 因 为 这 会 产生 悖 论 。 对 于 选 定 的 特定 
程序 ， 如 果 它 确实 能 够 停机 ， 那 么 我 们 可 以 运行 它 并 获得 一 个 程序 会 停机 的 证 据 。 如 果 无 法 
证 明 它 是 否 会 停机 ， 那 么 它 就 一 定 是 不 能 停机 的 ， 否 则 我 们 一 定 会 找到 能 证 明 它 会 停机 的 证 
据 。 于 是 我 们 又 可 以 用 这 个 推论 来 作为 它 不 会 停机 的 证 据 ! 

问 : 克拉 区 猜想 是 否 是 一 个 可 判定 的 问题 ? 

答 : 这 里 有 同一 个 问题 的 男 一 个 表述 。 西 普 塞 (Sipser) 用 下 面 的 方式 表示 它 : 如 果 在 
火星 上 有 生命 ,那么 令 工 为 由 所 有 由 1 组 成 的 字符 串 组 成 的 语言 ， 否 则 工 为 由 所 有 由 0 组 
成 的 字符 串 组 成 的 语言 。 那 么 工 是 可 判定 的 吗 ? 排除 中 间 的 条 件 判 断 ， 即 火星 上 要 么 有 生 
命 ， 要 么 没 生命 ,根据 以 上 论述 ， 这 个 问题 的 答案 为 真 。 无 论 如 何 ， 右 图 


的 图 灵机 中 肯定 有 一 个 是 语言 工 的 一 个 判别 器 ， 而 且 没 有 其 他 可 能 的 判别 0 3 
器 了 。 但 事实 上 我 们 无 法 知道 哪个 判别 器 是 我 们 应 采用 的 。 这 个 显而易见 “~1、 
的 悖 论 是 基于 语言 的 简单 性 。 这 个 猜想 是 可 判定 的 ， 但 是 我 们 不 知道 如 何 3 
证 明 它 是 真 的 还 是 假 的 ， 我 们 也 无 法 找到 一 个 反例 来 证 明 。 A 
问 : 是 否 能 编写 这 么 一 个 Java 程序 ， 这 个 程序 可 以 解决 不 使 用 库 函 0 


数 且 没有 输入 输出 的 Java 函数 的 停机 问题 ? le 
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答 : 有 的 人 可 能 会 说 这 是 有 可 能 的 ， 因 为 这 样 的 一 个 程序 只 能 使 用 有 限 的 内 存 。 但 是 这 


种 说 法 认为 我 们 的 计算 机 都 是 DFA， 而 且 它 们 的 性 能 也 是 天 文 数字 。 在 这 种 情况 下 ， 我们 
描述 的 理论 可 能 真 的 不 适用 ， 因 为 我 们 的 理论 的 前 提 是 每 个 程序 都 使 用 固定 数量 的 资源 ， 而 
这 里 编写 的 程序 所 需 的 所 谓 的 固定 数量 已 经 要 接近 无 穷 大 了 。 因 此 ， 你 可 以 相信 自己 的 直 
觉 ， 我 们 讨论 的 模型 抓 住 了 机 器 的 本 质 属性 。 


练习 


5.4.1 
5.4.2 


假设 在 邮政 通信 间 题 中 ， 每 种 类 型 的 卡 你 最 多 只 能 使 用 一 张 。 问 题 仍 然 是 不 可 判定 的 吗 ? 
找到 以 下 邮政 通信 系统 的 两 个 解决 方案 ,或 者 证 明 没 有 解决 方案 。 





部 分 解 : 34012212。 
找到 以 下 邮政 通信 系统 的 两 个 解决 方案 ， 或 者 证 明 没 有 解决 方案 。 


fF (8 fF fF fF 
BAA |||ABAA BABB ||| BAB 
AB |ll BA | ABA ||| ABBA 
0 1 2 3 4 


假设 邮政 通信 系统 的 字母 表 中 只 有 一 个 字母 ， 那 么 我 们 只 需要 找到 一 个 排列 使 得 顶部 和 底部 的 
字符 串 有 相等 数量 的 字符 即 可 。 在 这 种 情况 下 设计 一 个 算法 来 解决 邮政 通信 问题 。 

假设 存在 下 面 这 些 替 换 规 则 : aba 替换 为 bba，ba 替 为 bbb，baa 替换 为 aa， 是 否 存在 一 些 蔡 换 
规则 的 使 用 序列 《以 任何 顺序 均 可 )， 可 以 将 字符 串 baababbba 蔡 换 为 ababbbabbba ? (这 是 图 万 
词 问题 的 一 个 例子 ， 一 般 来 说 是 不 可 判定 的 。) 

修改 练习 2.3.29 的 解决 方案 中 为 了 计算 克拉 茨 问题 给 出 的 程序 ， 使 得 这 个 程序 可 以 使 用 Java 的 
BigInteger 类， 以 便 它 可 以 使 用 任意 长 度 的 整数 进行 计算 。 


创新 练习 


5.4.7 


5.4.8 


5.4.9 


图 灵机 的 停机 问题 。 根 据 文中 给 出 的 图 录 机 的 特征 ， 重 新 证 明 停机 问题 的 不 可 确定 性 。 

以 下 每 个 练习 都 要 求 你 证 明 给 定 的 问题 是 不 可 解 的 。 这 些 问 题 更 倾向 于 那些 研究 数学 的 读 
者 来 解决 ， 这 些 读 者 可 能 会 享受 通过 归 约 来 进行 这 些 证 明 的 乐趣 。 如 果 你 不 倾向 于 研究 数学 ， 
这 些 问题 对 你 来 说 仍然 是 值得 阅读 的 ， 因 为 这 可 以 加 深 你 对 不 可 解 问题 的 了 解 。 
自 停机 问题 。 我 们 是 否 可 以 编写 这 么 一 个 程序 ， 这 个 程序 可 以 判定 一 个 给 定 的 、 只 有 一 个 参数 
的 函数 将 它 自己 作为 输入 时 是 否 会 停机 。 通 过 对 一 个 停机 问题 输入 相似 的 参数 ， 我 们 可 以 证 明 
这 个 问题 是 不 可 判定 的 。 
穷 性 问题 。 穷 忙 函 数 BB(n) 有 如 下 定义 : 对 于 一 个 基于 二 进 制 字母 表 有 个 状态 的 图 灵机 ， 它 
有 一 个 起 始 状 态 为 空 的 纸 带 ， 穷 忙 函 数 即 在 保证 这 个 图 灵机 仍 会 停机 的 前 提 下 ， 图 灵机 可 以 在 
纸 带 上 留 下 1 的 最 大 个 数 。 证 明 BB(n) 是 不 可 计算 的 。 提 示 : 首先 运行 一 个 初始 输入 为 空 且 有 
(m+ nn) 个 状态 的 图 灵机 ,通过 在 这 个 图 灵机 上 模拟 有 个 状态 且 输 入 大 小 为 m 的 图 录 机 。 然 
后 ,按照 BB(m +7+1l) 步 又 运行 有 (m+n) 个 状态 的 图 灵机 。 


5.4.10” 空 纸 带 停机 问题 。 在 练习 5.4.7 中 ,我 们 使 用 了 一 个 把 自己 作为 输入 的 图 灵机 来 证 明 停机 问题 
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的 不 可 确定 性 。 这 种 人 为 的 自 关联 结构 简化 了 证 明 。 证 明 即 使 输入 纸 带 最 开始 是 空白 的 ， 停 
机 问题 也 是 不 可 确定 的 。 提 示 : 给 出 一 个 可 以 解决 初始 纸 带 为 空 的 图 灵机 的 停机 问题 的 方法 ， 
展示 它 是 如 何 计算 穷 忙 函数 BB(n) 的 。 

5.4.11 非 空 。 是否 存在 这 么 一 个 图 灵机， 它 可 以 判定 一 个 给 定 的 图 灵机 接受 的 语言 是 否 为 空 ”了 证明 这 
个 问题 是 不 可 判定 的 。 

5.4.12 ”常规 性 。 是 否 存 在 这 人 么 一 个 图 灵机 ， 它 可 以 判定 一 个 给 定 的 图 灵机 接受 的 语言 是 否 是 正则 
的 ? 证 明 这 个 问题 是 不 可 判定 的 。 


5.5 ” 难 解 性 


在 前 面 的 章节 中 ， 我 们 根据 是 否 能 被 计算 机 解决 来 对 间 题 进行 了 分 类 。 在 本 节 中 ， 我 们 
将 重点 放 在 我 们 可 以 解决 的 问题 上 ， 特 别 是 如 何 确定 解决 这 些 问题 所 需要 的 计算 资源 。 

在 本 书 中 我 们 研究 了 很 多 算法 ,这些 算法 普遍 用 于 解决 实际 问题 ， 而 且 它 们 消耗 的 计 
算 资 源 的 数量 是 合理 的 。 大 多 数 算法 带 来 的 实际 效益 是 显而易见 的 ， 对 于 许多 问题 ， 我 们 都 
有 很 多 高 效 的 算法 可 以 选择 。 不 幸 的 是 ， 许 多 在 实践 中 出 现 的 其 他 问题 不 能 使 用 这 些 有 效 的 
解决 方案 。 更 糟糕 的 是 ， 对 于 一 大 类 这 样 的 问题 ， 我 们 甚至 无 法 判断 是 否 存在 有 效 的 解决 方 
案 。 对 于 程序 员 和 算法 设计 人 员 来 说 ， 这 种 情况 是 十 分 令 人 诅 丧 的 ， 因 为 对 于 很 大 一 部 分 的 
实际 问题 他 们 找 不 到 适用 的 有 效 算法 ; 理论 家 们 也 同样 诅 形 ， 因 为 他 们 也 无 法 找到 有 效 的 方 
法 来 证 明 这 些 问题 确实 是 很 难 解决 的 。 

人 们 在 这 个 领域 已 经 做 了 大 量 的 工作 ， 这 导致 一 个 新 的 机 制 的 发 展 。 这 个 机 制 是 将 新 出 
现 的 这 些 问 题 在 特定 的 技术 意义 上 归 类 为 “难以 解决 ”的 问题 。 虽 然 这 些 工作 的 大 部 分 都 超 
出 了 本 书 的 范围 ,但 是 中 心思 想 是 相通 的 。 我 们 在 这 里 介绍 这 些 工作 是 因为 对 于 每 个 程序 员 
来 说 ， 当 他 们 面临 一 个 新 问题 时 ， 他 们 应 该 知道 这 个 问题 有 可 能 是 那些 没 人 知道 任何 有 效 算 
法 的 问题 ， 自 然 也 无 法 保证 能 找到 一 个 有 效 的 解决 方案 。 

在 前 面 两 节 中 ， 我们 研究 了 下 面 两 个 观点 ， 这 两 个 观点 源 于 20 世纪 30 年 代 艾 伦 ' 图 灵 
的 开创 性 工作 : 

。 普遍 性 。 一 个 图 灵机 能 够 执行 任何 可 以 用 物理 存在 的 计算 设备 描述 的 计算 (判定 语言 

或 者 计算 函数 )。 这 个 想法 被 称 为 鱼 奇 - 图 灵 理 论 。 把 这 个 理论 推广 到 自然 世界 时 是 
不 能 被 证 明 的 〈 但 它 有 可 能 是 错 的 )。 支 持 这 个 理论 的 证 据 是 ， 数 学 家 和 计算 机 科学 
家 已 经 研究 出 大 量 的 计算 模型 ， 但 是 它们 全 部 被 证 明 与 图 灵机 一 致 。 

。 可 计算 性 。 无 法 通过 图 灵机 来 解决 (根据 普遍 性 ， 也 可 以 说 是 通过 任何 物理 存在 的 计 

算 设备 都 无 法 解决 ) 的 问题 是 存在 的 。 这 是 一 个 著名 的 数学 事实 。 著 名 的 停机 问题 
(没有 程序 可 以 保证 能 够 确定 一 个 给 定 的 程序 是 否 会 停机 ) 就 是 这 样 的 一 个 问题 。 

在 目前 的 情况 下 ， 我 们 感 兴趣 的 是 第 三 个 观点 ， 即 计算 设备 的 效率 问题 : 

。 印 奇 -图 灵 理 论 的 扩展 。 一 个 图 灵机 能 够 有 效 地 执行 任何 可 以 用 物理 存在 的 计算 设备 

描述 的 计算 (判定 语言 或 者 计算 函数 )。 

同样 的 ， 这 个 命题 也 适用 于 对 自然 世界 的 描述 ， 因 为 所 有 已 知 的 物理 存在 的 计算 设备 都 
可 以 被 一 个 图 灵机 模拟 出 来 ， 只 不 过 运行 的 成 本 可 能 会 以 多 项 式 量 级 增加 。 例 如 ， 假 设 给 定 
的 任何 算法 都 能 在 你 的 计算 机 上 以 与 7(n) 成 比例 的 时 间 内 完成 运行 (其 中 是 输入 符号 的 数 
量 )， 则 我 们 可 能 会 构造 一 个 图 灵机 ， 它 执行 相同 的 计算 所 需 的 时 间 与 T(n) 成 正比 。 反 过 来 
说 ,我 们 的 程序 TuringMachine 证 明了 任何 执行 时 间 与 7(n) 成 正比 的 图 灵机 都 能 在 你 的 计算 
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机 上 以 正比 于 7(n) 的 时 间 来 模拟 。 印 奇 - 图 灵 理 论 的 扩展 意味 着 ， 从 理论 上 来 说 ， 为 了 造 
出 更 高 效 的 计算 机 ， 我 们 只 需要 关注 于 改进 当今 计算 机 设计 的 实现 技术 ， 而 不 是 创造 新 的 设 
计 方 案 。 

概览 ” 难 解 性 理论 的 目的 是 将 能 在 多 项 式 级 别 时 间 (polynomial time) 内 解决 的 问题 从 
需要 在 指数 级 别 时 间 (exponential time) 内 解决 的 问题 中 分 离 出 来 。 我 们 稍 后 会 给 出 这 些 术 
语 的 定义 ,但 是 理解 难 解 性 的 第 一 步 是 真正 理解 指数 增长 的 性 质 。 

你 可 以 试 着 估算 下 面 的 时 间 。 这 里 你 只 需要 粗略 地 计算 ， 不 用 考虑 细节 。 

。 地球 的 年 龄 大 概 为 10" 秒 。 

。 地球 的 表面 大 约 有 102 平方 米 。 

。 一 人 台 现 代 超级 计算 机 每 秒 大 约 可 执行 10* 条 指令 。 
把 这 些 数字 相 乘 ， 你 可 以 看 到 如 果 我 们 在 地 球 的 每 平方 英寸 上 有 一 台 超 级 计算 机 ， 它 们 并 行 
工作 与 地 球 年 龄 一 样 长 的 时 间 ， 我 们 可 以 计算 出 它们 能 执行 102 条 指令 。 作 为 参考 你 需要 知 
道 ，10” 要 比 352 ! 和 2” 这 两 个 数字 小 得 多 。 

作为 例子 ， 假 设 你 想 计 算 一 副 随 机 洗 牌 的 纸牌 的 所 有 可 能 性 ， 你 可 以 将 这 个 想法 忘掉 
了 ， 因 为 一 共有 52 ! 种 可 能 性 ， 在 这 个 世界 上 没有 人 可 以 给 出 所 有 的 可 能 性 。 事 实 上 ， 你 
检查 到 一 副 牌 是 你 想 要 的 排列 序列 的 概率 要 低 于 0.000 000 000 000 005， 不 深入 思考 你 无 法 
认识 到 这 一 点 。 

指数 级 的 增长 远 远 超 过 技术 变化 的 速度 : 一 台 超级 


计算 机 可 能 比 一 个 算盘 要 快 10s 倍 ， 但 是 它们 都 解决 不 二 级 计算 机 和 和 
了 需要 计算 2” 步 的 问题 。 另 外 ， 开 发 一 个 需要 运算 那 | 一 二 0 和 和 人 
么 多 步 的 算法 并 不 困难 ， 但 显然 它们 即便 耗 尽 所 有 的 可 丰 人 二 一 站 这 和 全 仙 
用 资源 也 无 法 获得 你 想 要 的 答案 ， 如 接 下 来 的 几 个 例子 WG 
所 示 。 10 平方 


问题 的 规模 。 这 个 理论 的 目的 是 找到 针对 大 量 算法 
的 共性 特征 描述 ， 图 灵机 模型 使 得 我 们 可 以 对 我 们 的 约 
定 进行 精确 的 描述 。 我 们 的 第 一 个 约定 是 我 们 通过 指定 
输入 的 位 数 (在 一 个 常数 内 ) 来 表示 问题 的 规模 。 由 于 我 
们 总 是 假设 我 们 的 字母 表 的 大 小 是 常数 ,“ 常 数 因子 ”的 


意思 是 在 一 个 图 灵机 的 模型 中 ， 我 们 将 纸 带 上 最 初 含有 i 


一 侣 超级 计算 机 ， 它 们 并 行 工作 


< 一 一 


的 符号 数 记 为 n (在 一 个 Java 程序 中 ,我 们 把 n 作为 命 
令 行 参数 或 者 标准 输入 的 数量 )。 

最 坏 情 况 。 本 节 中 的 所 有 理论 都 建立 在 最 坏 情况 分 
析 的 基础 上 。 也 就 是 说 ， 对 于 给 定 大 小 的 问题 ， 无 论 输 
入 是 什么 ;我 们 都 想 找 到 关于 算法 的 性 能 保障 (下限 )。 
如 果 一 个 算法 在 能 体现 它 优 势 的 输入 上 很 快 , 但 是 在 相 
对 较 少 的 输入 上 表现 很 慢 ， 那 么 我 们 认为 它 是 慢 的 。 采 
取 这 种 悲观 主义 方法 的 原因 主要 有 两 个 : 


地 球 生命 时 长 那样 长 的 时 间 能 够 
执行 105 条 指令 。 


二 一 200 个 元 素 的 子 集 有 22% 个 


熏 一 排列 一 副 扑 克 有 521 种 方式 


一 些 大 数字 (标尺 刻度 为 对 数 ) 


。 通常 来 说 ， 将 运行 时 间 上 限 作 为 输入 数据 规模 的 一 个 函数 的 方式 比较 简单 ， 而 用 输入 
数据 的 其 他 属性 来 表示 则 表示 困难 。 例 如 ， 研 究 平均 情况 可 能 是 一 个 有 吸引 力 的 选 
择 ， 但 是 这 需要 为 输入 开发 一 个 概率 模型 (这 本 身 就 是 一 个 挑战 )， 并 基于 这 个 模型 
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对 算法 行为 进行 数学 分 析 ( 这 可 能 更 具有 挑战 性 )。 

。 在 最 坏 情况 下 仍然 能 保证 性 能 的 算法 是 一 个 有 价值 的 目标 ， 经 常 在 实践 中 被 运用 并 且 
被 实际 应 用 所 需要 。 例 如 ， 你 肯定 会 更 愿意 见 到 用 来 让 你 的 飞机 着 陆 、 控 制 你 的 汽车 
刹车 或 者 控制 你 的 起 搏 器 的 软件 在 最 坏 的 情况 下 仍然 有 性 能 的 保障 。 

我 们 之 所 以 在 一 开始 就 强调 这 个 问题 ， 是 因为 计算 理论 的 研究 成 果 经 常 被 误解 。 具 体 来 
说 ， 在 一 些 典 型 的 实际 情况 下 ， 我 们 不 能 用 最 坏 情 况 的 性 能 来 预测 性 能 。 这 个 问题 需要 基于 
科学 方法 的 更 复杂 的 分 析 ， 正 如 我 们 在 4.1 节 中 讨论 的 那样 。 相 反 的 ， 我 们 关注 最 坏 情况 的 
目的 是 使 得 我 们 可 以 更 好 地 关注 计算 理论 中 最 基本 的 问题 。 

多 项 式 时 间 算 法 。 你 在 本 书 中 已 经 看 到 我 们 针对 很 多 问题 提出 了 有 效 的 解决 算法 。 难 解 
性 理论 的 第 一 步 就 是 尝试 将 这 些 问题 放 在 一 类 。 我 们 这 里 不 再 讨论 那些 问题 的 细节 ， 将 问题 
oar dee et 首先 ， 我 们 给 出 如 下 定义 :” 


定义 : dd de ih 
“上 限 为 ax 的 算法 ， 其 中 a。 和 5 都 是 正常 数 。 i [二 让 全 


为 了 便于 本 节 讨 论 ， 我 们 不 关心 常量 的 值 ， 而 是 关注 于 一 一 不 算法 对 于 所 有 输入 的 运行 
间 上 限 。 例 如 ， 我 们 在 4.2 节 中 学 习 的 排序 算法 就 是 一 种 多 项 式 时 间 算 法 ， 我 们 证 明了 它 在 
最 坏 情 况 下 的 运行 时 间 与 n log n 或 者 w 成 正比 。 如 果 一 个 问题 有 一 个 多 项 式 时 间 算 法 ， 那 
么 我 们 认为 这 个 问题 是 “容易 解决 的 ”。 我 们 的 目标 是 将 “容易 解决 的 ”问题 从 我 们 接 下 来 
要 考虑 的 “难以 解决 的 ”问题 中 分 离 出 来 。 

指数 级 时 间 算 法 。 也 有 很 多 问题 ， 我 们 不 知道 任何 有 效 的 算法 以 用 作 它 们 的 解决 方案 。 
难 解 性 理论 的 第 二 步 是 尝试 将 所 有 这 样 的 问题 放 在 一 类 。 与 前 面 一 样 ， 我 们 不 讨论 那些 不 必 
了 将 分 析 简 化 成 建立 一 个 最 坏 情 况 的 运行 时 间 下 限 。 为 此 ， 我 们 给 出 以 下 定义 : 


定义 : 指数 级 时 间 算法 是 运行 时 间 取决 于 输入 的 规模 ， SN 划 
时 间 下 限 为 2 的 算法 , 其 中 a 和 4b 都 是 正常 数 。，。 


这 次 我 们 同样 不 关注 常量 的 值 ， 而 是 关注 于 对 于 某 一 类 无 限 多 的 输入 ， 指 数 级 时 间 算 法 
运行 时 间 的 下 限 。 例 如 ，2.3 节 中 的 汉 诺 塔 问题 的 解决 方案 和 与 它 相 关 的 算法 是 指数 级 的 ， 
因为 我 们 证 明了 它们 的 运行 时 间 与 2n 成 正比 。 需 要 说 明 的 是 ， 这 个 定义 将 1:5n、n! 和 2 
的 运行 时 间 也 认为 是 指数 级 的 ( 见 练 习 5.5.3 )。 如 果 对 于 一 个 问题 我 们 只 知道 指数 级 的 算 
法 ,我 们 认为 这 个 问题 是 “难以 解决 的 ”。 

考虑 到 用 多 项 式 时 间 算 法 解决 的 问题 和 需要 指数 时 间 算 法 的 问题 之 间 存 在 巨大 的 性 能 差 
异 ， 你 可 能 会 认为 这 种 差异 很 容易 区 分 ， 但 事实 并 非 如 此 ， 我 们 会 在 本 节 中 完整 地 讨论 难 解 
性 理论 的 信息 ， 并 且 证 明 这 个 令 人 惊讶 的 结论 。 

例子 “为 了 更 好 地 理解 这 些 概念 ， 接 下 来 我 们 会 在 涉及 许多 不 同类 型 数据 的 算法 问题 中 
讨论 这 些 概念 。 有 很 多 是 科学 家 、 工 程 师 和 应 用 程序 员 (和 你 ) 正在 解决 并 且 渴 望 解决 的 问 
题 ， 我 们 做 的 这 些 事 为 讨论 这 些 问 题 提供 了 一 个 更 加 正式 的 舞台 。 所 有 这 些 问 题 都 有 许多 重 
要 的 应 用 ,但 是 我 们 不 会 对 这 些 问 题 进行 详细 的 描述 ， 从 而 避免 让 你 从 这 些 问 题 最 根本 的 属 
性 上 分 散 注意 力 。 

数字 。 作 为 第 一 个 例子 ， 我 们 来 讨论 可 以 处 理 任意 精度 的 整数 的 算法 。Java 中 的 
BigInteger 类 可 以 帮助 你 完成 这 些 计算 。 例 如 ， 通 过 使 用 BigInteger， 你 可 以 很 简单 地 使 用 
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小 学 学 过 的 知识 在 二 次 方 时 间 内 完成 两 个 位 整数 相 乘 的 运算 (当然 ， 现 在 已 经 有 更 高 效 的 
算法 )。 但 是 下 面 的 问题 似乎 要 困难 得 多 : 

素数 分 解 : 为 一 个 给 定 的 n 位 正 整 数 找到 其 素数 因子 。 

你 可 以 通过 将 Factors (程序 1.3.9 ) 转换 为 BigInteger 来 解决 这 个 问题 ( 见 练习 5.5.36 )。 
但 是 这 个 解决 方案 对 于 多 位 数 的 n 来 说 是 不 可 行 的 ， 因 为 对 于 一 个 n 位 的 素数 来 说 循环 迭 代 
的 次 数 是 10” 次 。 例 如 对 于 1000 位 的 素数 ， 它 将 迭代 大 约 10 500 次 。 没 有 人 知道 解决 这 
个 问题 的 合适 方法 。 事 实 上 ， 互 联网 商业 使 用 的 RSA 协议 之 所 以 能 提供 安全 性 就 是 基于 这 
种 分 解 的 困难 程度 。 

子 集 。 作 为 第 二 个 例子 ， 我 们 来 研究 子 集 的 求 和 问题 ， 这 个 问题 包含 了 我 们 在 4.1 节 中 
提 到 的 三 集合 的 问题 。 

子 集 的 和 : 为 n 个 给 定 的 整数 找到 一 个 ( 非 空 的 ) 子 集 ， 这 个 9 人 各 
子 集 的 和 为 0 或 者 返回 “这 个 子 集 不 存在 ”。 So 

原则 上 来 说 ， 你 可 以 通过 编写 一 个 尝试 所 有 可 能 性 的 程序 来 解 ”1342,-1 991,231, -351, 1000 
决 这 个 问题 ( 见 练习 5.5.4); 但 是 对 于 一 个 很 大 的 n， 程 序 将 不 会 ”所 有 可 能 性 : 
结束 ， 因 为 对 于 nn 个 元 素 的 集合 来 说 有 2" 个 不 同 的 子 集 。 有 一 个 “0 
很 简单 的 方法 可 以 让 你 相信 这 个 事实 ,将 一 个 任意 7 位 的 三 进 制 数 
对 应 于 个 元 素 的 子 集 ， 根 据 1 的 位 置 来 决定 子 集中 包含 的 元 素 。 
右边 给 出 了 一 个 例子 ,每 个 二 进 制 数字 的 右边 是 与 之 对 应 的 子 集 的 
和 。 同 样 的 ， 当 = 200 时 考虑 所 有 的 可 能 性 是 不 可 能 的 。 没 有 人 
能 知道 在 n 很 大 的 时 候 能 保证 解决 这 个 问题 的 算法 (即使 我 们 可 以 
解决 一 个 特定 的 问题 实例 一 一 例如 ， 我 们 在 寻找 的 早期 就 找到 了 一 
个 和 为 0 的 子 集 )。 

在 第 三 个 例子 中 ,为 了 强调 子 集 的 概念 会 出 现在 各 种 各 样 的 问 
题 中 ， 我 们 考虑 以 下 问题 : 

顶点 覆盖 : 给 定 一 个 图 G 和 一 个 整数 m， 在 G 中 寻找 一 个 最 
多 有 mw 个 顶点 的 子 集 ， 这 些 顶 点 应 该 与 所 有 的 边 相 连接 ， 或 者 返 
回 “ 这 样 的 子 集 不 存在 ”。 

右 图 给 出 了 一 个 例子 ， 大 小 为 1 和 2 的 子 集 都 用 深 色 的 顶点 
标注 出 来 ， 有 两 种 情况 可 以 作为 这 个 问题 的 正确 答案 ( 即 没 有 任何 
一 条 边 的 两 个 顶点 都 是 灰色 的 )。 为 了 对 应 用 程序 的 功能 有 个 更 加 
自然 的 感受 ， 我 们 可 以 将 顶点 看 作 路 由 器 ， 将 边 看 作 网 络 连接 。 然 
后 顶点 覆盖 就 可 以 告诉 一 个 网 络 攻击 者 是 否 可 以 通过 瘫痪 m 个 顶 
点 达到 令 所 有 通信 失效 的 目的 (或 者 告诉 防御 者 是 否 可 以 通过 保护 
贡 个 顶点 保证 至 少 有 一 条 通信 和 链 路 受到 保护 )。 在 这 个 例子 中 ， 当 
m 较 小 的 情况 下 ， 正 确 答案 的 数量 是 关于 m 的 多 项 式 ， 而 m 较 大 
的 时 候 则 是 指数 形式 ( 见 练习 5.5.6 )。 很 快 我 们 会 再 一 次 研究 一 个 
通过 尝试 所 有 可 能 性 来 解决 这 个 问题 的 程序 ， 但 是 我 们 要 强调 的 i 
是 只 有 挛 很 小 的 时 候 才 能 发 挥 作 用 ， 当 产 很 大 时 ， 这 个 程序 不 会 1342, -1991, —351, 1000 
终止 。 子 集 和 问题 的 一 个 示例 
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“难以 解决 ”的 问题 。 对 于 刚刚 描述 的 所 有 问题 ;要 想 找到 解决 方案 都 需要 “尝试 所 有 
的 可 能 性 ”。 每 个 用 计算 机 解决 问题 的 人 都 必须 明白 ， 这 ”问题 : 

样 的 解决 方法 并 不 总 是 有 效 的 ， 因 为 会 面临 指数 增长 的 a 

问题 。 这 与 你 凭 直觉 认为 计算 机 速度 很 快 ， 如 果 有 足够 与 所 有 边 相 连接 

的 时 间 就 可 以 解决 任何 问题 的 看 法 是 想 反 的 (你 可 以 问 问 人 
你 的 朋友 ， 看 他 们 是 否 觉得 计算 机 已 经 快 到 足以 算出 一 
副 扑 克 牌 的 所 有 排列 )。 如 果 一 个 问题 的 已 知 算法 都 要 用 
指数 级 时 间 解 决 ， 那 么 我 们 认为 这 个 问题 是 “难以 解决 ” | 个 
的 ， 就 像 前 文 定义 的 一 样 ， 我 们 通常 假定 一 个 指数 级 时 | | 
间 算 法 的 大 小 限定 在 1000 以 内 。 因 为 没有 人 可 以 等 待 一 
个 算法 执行 2 或 者 1000! 步 ， 不管 计算 机 的 运行 速度 
有 多 快 。 

“易于 解决 ”的 问题 。 相 比 之 下 ， 我 们 面临 的 很 多 问 
题 并 不 需要 我 们 尝试 所 有 的 可 能 性 (甚至 是 大 部 分 的 可 
能 性 )， 并 且 即 使 这 些 问 题 的 规模 很 大 ， 我 们 也 可 以 设计 
出 有 效 解决 的 算法 。 如 果 对 于 一 个 问题 我 们 知道 一 种 多 
项 式 时 间 算 法 可 以 解决 它 ， 那 么 我 们 认为 这 个 问题 是 ' 易 
于 解决 ”的 ， 就 像 前 文 定义 的 一 样 。 一 般 来 说 ， 我 们 常 
用 到 的 基本 计算 功能 都 是 建立 在 这 样 的 算法 上 的 。 

一 条 界线 。 有 时 候 ,“ 简 单 ”问题 和 “困难 ”问题 之 
间 的 界线 是 很 好 判别 的 。 例 如 : 

最 短路 径 。 在 一 个 给 定 的 图 中 ， 给 定 一 个 顶点 s 和 
t， 找 到 一 条 从 s 到 1 最 多 有 m 条 边 的 路 径 ， 或 者 报告 不 
存在 这 样 的 路 径 。 

我 们 在 4.1 节 中 的 程序 PathFinder 给 出 这 个 问题 的 
最 优 解 (找到 最 短路 径 )， 并 给 出 了 一 个 即时 的 解决 方案 。 
但 是 我 们 没有 研究 过 下 面 这 个 问题 的 算法 ， 这 个 问题 看 
起 来 与 最 短路 径 似乎 是 一 样 的 。 一 个 项 点 覆盖 实例 

最 长 路 径 : 在 一 个 给 定 的 图 中 ， 给 定 一 个 顶点 s 和 1t， 找 到 一 条 从 s 到 1 最 少 有 加 条 边 
的 路 径 ， 或 者 报告 不 存在 这 样 的 路 径 。 

问题 的 麻烦 之 处 就 在 于 ， 就 我 们 所 知 ， 这 两 个 问题 的 难度 几乎 处 于 两 个 极端 。 广 度 优先 
搜索 为 第 一 个 问题 提供 了 一 个 线性 时 间 的 解决 方案 ,但 是 对 于 第 二 个 问题 ， 所 有 的 已 知 算法 
在 最 坏 的 情况 下 都 需要 指数 时 间 来 完成 ， 因 为 它们 有 可 能 需要 检查 所 有 的 路 径 。 

一 般 来 说 ， 当 我 们 知道 一 个 问题 是 “易于 解决 ”的 时 候 ; 我 们 就 可 以 改进 算法 ,并 且 和 希 
望 通过 技术 上 的 提升 让 我 们 能 够 用 这 个 算法 解决 越 来 越 多 的 问题 实例 (实际 上 ， 典 型 的 “ 易 
于 解决 ”的 问题 是 可 以 保证 在 一 个 运行 时 间 界 限 内 解决 的 ， 这 个 界限 由 输入 规模 的 多 项 式 来 
决定 ， 如 妈 或 到 )。 当 我 们 知道 一 个 问题 是 “难以 解决 ”的 ， 我 们 就 不 能 指望 技术 上 的 进步 
来 帮助 我 们 解决 问题 。 那 么 哪些 问题 是 “易于 解决 ”的 ， 哪 些 问题 是 “难以 解决 ”的 呢 ? 我 
们 即将 考虑 的 理论 能 够 帮助 我 们 回答 这 个 问题 。 从 实际 的 角度 看 ， 这 一 理论 与 可 计算 性 理论 
一 样 重要 。 
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可 满足 性 ”有 四 个 特殊 的 问题 被 称 为 可 满足 性 问题 ， 这 些 问题 在 我 们 讨论 难 解 性 时 很 重要 。 

线性 方程 的 可 满足 性 : 给 定 一 组 包含 nn 个 变量 的 n 个 线性 方程 ， 对 所 有 变量 找到 一 个 有 
理 数 解 来 满足 所 有 方程 ， 或 者 报告 没有 解 存在 。 

线性 不 等 式 的 可 满足 性 : 给 定 一 组 包含 n 个 变量 的 m 个 线性 不 等 式 ， 对 所 有 变量 找到 
一 个 有 理 数 解 来 满足 所 有 不 等 式 ， 或 者 报告 没有 解 存在 。 

整数 线性 不 等 式 的 可 满足 性 : 给 定 一 组 包含 n 个 变量 的 m 个 线性 不 等 式 ， 对 所 有 变量 
找到 一 个 整数 解 来 满足 所 有 不 等 式 ， 或 者 报告 没有 解 存在 。 

布尔 可 满足 性 : 给 定 一 组 包含 n 个 布尔 变量 的 m 个 方程 ,对 所 有 变量 找到 一 个 布尔 值 
解 来 满足 所 有 方程 ， 或 者 报告 没有 解 存在 。 

由 于 计算 机 在 工业 和 商业 中 得 到 了 广泛 的 应 用 ， 这 些 问题 是 广泛 适用 的 ,并且 在 过 去 的 
几 十 年 中 发 挥 了 核心 作用 。 尽 管 这 些 问题 有 相似 之 处 ， 但 是 要 解决 这 些 问 题 所 面临 的 挑战 在 
本 质 上 有 着 惊人 的 差异 ， 下 面 我 们 对 它们 进行 简要 描述 。 

线性 方程 的 可 满足 性 。 你 熟悉 的 这 个 问题 是 “ 联 立 解 方程 式 ”， 解 决 这 个 问题 的 算法 一 
般 被 称 为 高 斯 消 元 法 ( Gaussian elimination)， 这 个 算法 可 以 追溯 到 中 国 古 代 ， 并 且 自 18 世 
纪 以 来 一 直 在 代数 类 中 教学 。 这 种 基本 的 算法 很 容易 被 实现 “问题 ， 


( 见 练习 5.5.2)， 并 且 可 以 在 标准 的 数值 型 线性 代数 库 中 使 用 。 4x—2y -z=-1 
当 变 量 的 值 是 double 型 时 ， 实 现 一 个 对 于 所 有 的 输入 都 能 正常 4x+4y+10z=9 
工作 的 高 斯 消 元 程序 实际 上 是 一 个 挑战 (因此 建议 使 用 函数 库 12x+4y+8z=21 


中 实现 好 的 版 本 )。 并 不 是 所 有 版 本 的 高 斯 消 元 法 都 是 多 项 式 时 解 : 
间 的 ， 因 为 中 间 计 算 有 可 能 按照 指数 规律 进行 ， 但 是 有 一 些 标 X=5/4 y=7/2,2=—l 
准 版 本 的 高 斯 消 元 法 已 经 被 证 明 是 多 项 式 时 间 的 (使 用 库 函 数 ”一 个 线性 方程 可 满足 性 的 实例 
的 另 一 个 理由 )。 尽 管 存在 这 些 技术 挑战 ， 但 是 认为 这 个 问题 
“易于 解决 ”是 合理 的 。 

线性 不 等 式 的 可 满足 性 。 现 在 假设 我 们 联 立 的 方程 中 允许 存在 不 等 式 ， 而 不 仅仅 只 有 等 
式 方程 (而且 我 们 可 以 允许 比 变 量 更 多 的 不 等 式 )。 这 个 变化 产生 了 一 个 经 典 问 题 的 一 个 版 
本 ， 即 线性 规划 (linear programming, LP) 问题 。 这 个 问题 是 20 世纪 中 期 为 了 战争 时 的 物流 
规划 而 提出 的 ， 有 一 种 著名 的 解决 这 个 问题 的 算法 叫 单纯 形 法 (simplex method)， 这 个 算法 
是 乔治 * 丹 齐 格 在 1947 年 发 明 的 ， 并 一 直 成 功 使 用 至 今 。 


单纯 形 法 比 高 斯 消 元 淡 复 杂 得 多 ， 但 是 经 过 一 些 研究 你 可 6_iw -<0 

以 理解 这 个 方法 背后 的 思想 ， 而 且 这 种 算法 也 是 可 以 被 广 人 

泛 实现 的 。 但 是 单纯 形 法 可 能 需要 指数 级 时 间 来 运行 (或 者 和 
更 精 )。 关 于 线性 规划 是 否 存在 多 项 式 时 间 算法 的 问题 讨论 内 这 0 

了 数 十 年 ， 直 到 20 世纪 80 年 代 中 期 才 得 以 解决 。 从 技术 解 

上 讲 ， 现 在 我 们 认为 这 个 问题 是 “易于 解决 ”的 。 线 性 规 x= 10,y=5110;z=9 

划 的 现代 实现 方法 被 广泛 用 于 各 种 工业 和 管理 应 用 中 。 航 一 个 线性 不 等 式 可 满足 性 的 实例 
空 时 刻 表 或 者 快递 邮件 可 能 都 是 线性 规划 问题 解决 方案 的 。 (寻找 线性 规划 的 表达 ) 


一 部 分 ， 其 中 可 能 涉及 数 十 万 个 不 等 式 。 

整数 线性 不 等 式 的 可 满足 性 。 如 果 线 性 规划 问题 中 的 变量 代表 航空 公司 的 飞行 员 或 者 卡 
车 ， 则 有 必要 保证 解决 方案 中 变量 的 值 是 整数 。 这 个 问题 被 称 为 整数 线性 规划 ( Integer 
Linear Programming, ILP)。 在 某 些 应 用 程序 中 ， 我 们 将 变量 的 值 限 制 为 0 或 者 1， 这 种 版 本 
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被 称 为 0/1ILP。 你 可 能 会 惊讶 地 发 现 这 些 问 题 没有 多 项 式 时 间 的 算法 。 解 决 ILP 的 一 个 方法 
是 先 解决 相同 的 LP 以 得 到 一 个 分 数 解 ， 然 后 将 这 个 分 


数 解 转 化 为 最 接近 的 整数 一 一 这 可 能 是 一 个 解决 方案 的 问题: 

起 点 ， 但 它 并 不 总 是 有 效 的 。 有 一 些 软件 包 可 以 解决 实 0 

际 中 出 现 的 ILP 实例 : 这 种 软件 被 广泛 用 于 各 种 工业 和 37 十 》 士 25 天 54 

商业 应 用 中 。 但 是 存在 这 种 软件 的 速度 太 慢 而 不 能 使 用 ph 

的 实例 ， 所 以 研究 人 员 仍然 在 寻找 更 快 的 算法 。 据 我 们 全 hae 站 

所 知 ; LP 和 ILP 之 间 的 区 别 代表 着 我 们 可 以 在 多 项 式 

时 间 内 解决 的 问题 与 需要 指数 时 间 解决 的 问题 之 间 的 一 。 ”全 


条 “ 细 线 ”。ILP 是 “易于 解决 ”还 是 “困难 ”的 ? 这 
831| 个 研究 问题 已 经 研究 了 几 十 年 ， 目 前 还 没有 找到 它 的 答案 。 


问题 : 布尔 可 满足 性 。 如 果 我 们 联 立 的 方程 组 


ta me 是 布尔 方程 组 ， 那么 就 有 了 布尔 可 满足 性 的 
ea 问题 (SAT)。 如 果 你 不 熟悉 布尔 代数 或 者 需 
x+] = tue 要 复习 ， 请 阅读 我 们 在 7.1 节 开 头 进行 的 处 


简单 表示 : 
s=0+D) ty +tD) E+ e+y) = true 


所 有 可 能 性 (T 代 表 真 ，E 代 表 假 ) : 


理 。 我 们 的 变量 有 两 个 值 一 一 假 和 真 ， 我 们 
使 用 三 个 操作 : x' 表 示 对 x 取 非 ， 即 当 x 为 
真 的 时 候 x' 为 假 ， 当 x 为 假 的 时 候 x' 为 真 ; 
XxX+y 表 示 “x 或 y”"， 即 当 x 和 7 都 为 假 时 ， 


~ 


(2) 让 ty 


为 候 ; 其 他 情况 都 为 真 ; 区 表示 “x 
人 1 7 与 7 即 当 x 和 yy 都 为 走时 , xy 为 真 ， 其 
到 箔 条 7 7 T Fr 他 情况 都 为 假 。 左 边 是 一 个 例子 。 通 常情 况 
名 天 梁 F 多 7 ZT 下; 我 们 假设 等 号 右 侧 全 部 为 真 并 上 且 等 号 左 
从 7 TT ”7 侧 的 每 个 方程 式 都 没有 使 用 与 操作 :( 见 练习 
人 | f 5.5.8 )。 我 们 也 可 以 使 用 一 个 简单 表示 : 将 
所 有 方程 的 等 号 左 侧 用 与 操作 连接 起 来 放 在 
xX=false 蔗 =1True 单个 方程 式 中 。 左边 还 显示 了 一 个 表格 ， 这 
Dr 个 表格 列 出 了 每 个 变量 和 每 个 左 侧 表达 式 所 
Ee 有 可 能 的 值 ， 表 格 中 还 标 出 了 哪些 是 我 们 需 

一 个 布尔 可 满足 性 的 实例 (SAT) 要 的 解决 方案 ( 即 所 有 值 都 为 真 的 两 行 )。 


SAT 看 起 来 似乎 是 一 个 抽象 的 数学 问题 ， 但 是 它 有 许多 重要 的 应 用 。 例 如 它 可 以 模拟 电 
路 的 行为 ， 所 以 它 在 现代 计算 机 的 设计 中 起 着 至 关 重 要 的 作用 。 与 ILP 一 样 ， 人 们 已 经 开发 
出 了 可 以 解决 实际 中 出 现 的 问题 实例 的 算法 ， 并 且 “ SAT 求解 器 ”已 经 被 广泛 使 用 。 唐 纳 
德 . E. 克 努 特 (D. E. Knuth) 估计 一 个 可 以 适应 工业 强度 的 SAT 求解 器 是 一 个 价值 十 亿美 元 
的 产业 。 但 是 SAT 与 ILP 一 样 ， 在 已 知 的 所 有 算法 中 没有 多 项 式 时 间 的 算法 一 一 每 个 SAT 
求解 器 都 会 在 一 些 实例 问题 上 以 指数 时 间 来 运行 。 
可 满足 性 问题 是 各 类 计算 型 应 用 程序 的 典型 示例 。 我 们 很 容易 用 公式 表示 问题 ， 也 很 容 
易 找 到 各 种 各 样 的 应 用 程序 ， 但 是 辨别 “易于 解决 的 ”问题 和 “难以 解决 的 ”问题 之 间 的 差 
异 可 能 是 非常 具有 挑战 性 的 。 这 个 挑战 在 计算 发 展 的 初期 就 已 经 显现 出 来 ， 而 且 它 还 促进 了 
[区 2 我 们 将 要 描述 的 理论 框架 的 发 展 。 
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搜索 问题 在 “易于 解决 的 ”问题 和 “难以 解决 的 ”问题 之 间 存 在 巨大 的 差距 ， 这 使 得 
我 们 可 以 用 一 个 简单 且 正 式 的 模型 来 划分 它们 之 间 的 边界 。 我 们 的 第 一 步 是 描述 研究 的 问题 
的 类 型 : 





到 目前 为 止 ， 本 节 提 到 的 所 有 问题 (排序 、 分 解 乘法 、 最 短路 径 、 最 长 路 径 ， 布 东 可 清 
足 性 等 ) 都 是 搜索 问题 。 要 确定 一 个 问题 是 不 是 搜索 问题 ， 我 们 只 需要 确定 对 于 任意 一 个 解 
决 方案 ， 我 们 都 可 以 高 效 地 验证 它 是 否 正确 。 解 决 一 个 搜索 问题 就 像 大 海 捞 针 ， 唯 一 的 条 件 
是 当 你 看 到 针 的 时 候 你 可 以 认 出 这 是 一 根 针 。 例 如 在 布尔 可 满足 性 问题 中 ， 如 果 你 给 每 个 变 
量 赋 值 ， 那 么 你 可 以 轻松 地 检查 每 个 方程 或 者 不 等 式 是 否 被 满足 ， 但 是 搜索 一 个 这 样 的 赋值 
(或 者 确定 是 否 存在 ) 却 是 一 个 艰巨 的 任务 。 

NP 通常 用 于 描述 搜索 问题 。 许 多 人 把 NP 当 作 是 “ 非 多 项 式 ”(not polynomial) 的 缩写 ， 
en nr ee sr sshd ys ep tha 

NP 是 对 科学 家 工程 师 和 应 用 种 序 员 都 注重 能 劈 在 合理 时间 内 解 闫 的 所 有 问题 的 精 衫 
描述 。 在 后 面 ， 我 们 对 NP 中 那些 已 经 讨论 过 的 问题 进行 了 总 结 。 接 下 来 我 们 更 加 仔细 地 研 
究 几 个 例子 。 

NP 中 的 子 集 求 和 问题 。 想 要 证 明 一 个 问题 是 搜索 问题 ， 
只 要 提供 的 Java 代码 能 (在 多 项 式 时 间 内 ) 检查 一 个 推定 的 
解决 方案 是 否 在 给 定 的 输入 下 真正 地 解决 了 这 个 问题 。 例 如 ， 
假设 我 们 将 子 集 求 和 问题 的 输入 保存 在 一 个 整数 数组 values[] 
中 ， 然 后 维护 一 个 布尔 型 数组 inSubset[] ， 如 果 这 个 数组 中 标 
为 true， 则 表示 子 集中 包含 相应 的 值 。 在 上 面 的 表格 里 ， 我 们 
给 出 了 前 文 “ 子 集 求 和 ”示例 的 值 。 通 过 这 种 表示 ， 检 查 子 集 求 和 是 否 为 0 的 Java 代码 变 
得 十 分 简单 : 


public static boolean check(int[] values, boolean[] inSubset) 
和 









values[i] inSubset[i] 
1342 true 
-=1991 true 


-351 true 


E 
0 
1 
2 231 false 
3 
4 1000 true 


int sum = 0; 
for (Cint 1 = 0; 1 < ni i++) 
if (inSubset[i]) 
sum += values[i]; 
return sum == 0; 


在 这 种 情况 下 ， 检 查 解决 方案 是 否 有 效 的 操作 在 对 数据 进行 扫描 后 即 可 完成 ， 这 个 操作 
只 需要 线性 时 间 。 这 是 NP 中 的 典型 问题 之 一 ， 其 表达 的 基本 特点 是 : 当 我 们 看 到 NP 问题 
的 一 个 解决 方法 时 ， 我 们 可 以 轻易 地 辨认 出 它 是 不 是 正确 答案 。 

NP 中 的 项 点 覆盖 问题 。 我 们 可 以 用 同样 的 机 制 来 证 明 顶 点 覆盖 问题 在 NP 中 。 假设 我 
们 的 输入 用 图 G 表示 ， 这 个 图 采用 4.1 节 中 使 用 的 图 数据 类 型 来 存储 ， 并 且 用 一 个 整数 m 
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来 表示 子 集 大 小 的 上 限 。 我 们 可 以 用 一 个 布尔 类 型 的 数组 inSubset[] 来 表示 项 点 覆盖 问题 的 
解决 方案 ,数组 中 的 每 个 true 元 素 对 应 每 个 被 包含 在 解决 方案 中 的 顶点 。 然 后 ， 为 了 检查 这 
个 顶点 的 子 集 是 否 符合 顶点 覆盖 的 定义 ,我 们 需要 : 

。 确保 子 集中 的 顶点 数量 (inSubset[] 中 true 元 素 的 个 数 ) 小 于 或 者 等 于 m。 

。 检查 图 中 所 有 的 边 ， 确 保 没有 边 连接 的 两 个 顶点 都 不 在 子 集 中 。 

这 些 检 查 很 容易 完成 ( 见 练 习 5.5.7 )。 同 时 ， 这 些 检查 的 成 本 与 输入 的 大 小 是 呈 线 性 关系 的 。 

NP 中 的 0/1 ILP。 现 在 我 们 来 分 析 0/1 ILP 是 否 在 NP 中 。 假 设 我 们 的 输入 由 一 个 mxn 
的 矩阵 a[][] 表示 ， 等 号 右 侧 是 一 个 长 度 为 m 的 向 量 b[]。 我 们 用 长 度 为 n 的 向 量 x[] 来 表示 
一 个 解 。 然 后 ， 为 了 检查 一 个 声明 的 解 向 量 x[] 是 否 确实 是 一 个 解 ， 我 们 需要 : 

。 检查 每 个 元 素 x[j] 是 0 还 是 1。 

。 检查 每 个 不 等 式 i 是 否 都 有 

a[i][0] * x[0] + afi][1] * x[1] +*** + aflil[n ~ 1]*x[n-1] b[] 

这 些 检查 很 容易 在 与 输入 的 大 小 旦 线性 关系 的 时 间 内 完成 ( 见 练习 5.5.11 )。 相 似 地 ， 我 们 
可 以 得 出 SAT 是 一 个 NP 问题 。 但 是 要 证 明 ILP 是 NP 问题 , 我们 需要 更 仔细 地 论证 (超出 我 
们 的 范围 )， 因 为 ILP 问题 (没有 0/1 限制 ) 的 解决 方案 中 的 值 从 理论 上 来 说 可 能 是 指数 量 级 的 。 

找到 一 个 解决 方案 。 要 解决 一 个 搜索 问题 ,真正 的 计算 负担 在 于 如 何 找到 一 个 解决 方 
案 。 正 如 指出 的 那样 ， 我 们 知道 解决 许多 问题 的 最 好 方法 基本 上 是 尝试 所 有 可 能 的 解决 方 
案 。 在 本 节 稍 后 的 部 分 我 们 会 考虑 一 个 SAT 的 例子 ( 见 程 序 5.5.1 )。 本 质 上 来 说 ， 程 序 需要 
做 的 就 是 对 于 大 小 为 n 的 问题 找 出 全 部 的 2 个子 集 ， 这 需要 指数 时 间 来 完成 。 

我 们 通过 搜索 问题 来 定义 NP 的 方法 只 是 文献 中 被 广泛 接受 的 三 种 方法 之 一 ， 这 些 文献 
描述 了 一 些 问 题 ， 这些 问题 构成 了 难 解 性 研究 的 基础 。 男 外 的 两 种 方法 是 决策 问题 (是 否 存 
在 解决 方案 ? ) 和 优化 问题 (这 是 最 好 的 解决 方案 吗 ) ? 例如 有 三 种 提出 顶点 覆盖 问题 的 方 
式 。 给 定 图 G， 我 们 有 下 列 三 个 问题 : 

。 优化 : 对 图 G 找到 一 个 包含 顶点 数量 最 少 的 顶点 覆盖 解决 方案 。 

。 决策 : 当 最 多 有 m 个 顶点 时 ,图 G 是 否 存在 顶点 覆盖 的 解决 方案 ? 

。 搜索 : 为 图 G 找到 一 个 最 多 有 m 个 顶点 的 顶点 覆盖 解决 方案 。 

虽然 在 技术 上 并 不 相同 ,但 这 三 种 定义 NP 的 方法 之 间 的 关系 已 经 得 到 了 深入 的 研究 ， 
我 们 得 出 的 主要 结论 也 都 适用 于 所 有 这 三 类 问题 。 为 了 避免 混淆 ， 我 们 专注 于 研究 搜索 问 
题 。 当 我 们 使 用 “LP” 这 个 名 字 时 ,我们 的 意思 是 “LP 的 搜索 问题 表述 ”。 从 这 个 角度 来 
看 ， 我 们 在 使 用 “在 NP 中 ”和 “搜索 问题 ”这 两 个 术语 时 是 不 带 注解 地 交换 使 用 的 ， 所 以 
你 应 该 小 心 ， 不 要 认为 这 两 个 术语 是 完全 相同 的 。 

不 确定 性 。NP 中 的 N 代表 不 确定 性 (nondeterminism)。 它 代表 了 这 样 的 观点 : 扩展 计 
算 机 力量 的 一 种 方式 (从 理论 上 讲 ) 是 赋予 其 不 确定 性 的 力量 ， 即 当 一 个 算法 面临 在 几 个 选 
项 中 做 出 选择 时 ， 它 有 能 力 “ 猜 出 ”正确 的 那个 。 不 确定 性 可 能 是 一 个 数学 上 的 虚幻 构想 ， 
但 它 是 一 个 很 有 用 的 想法 (例如 ， 在 5.1 节 中 我 们 可 以 看 到 不 确定 性 对 于 算法 设计 是 很 有 用 
的 一 一 通过 模拟 一 个 非 确定 性 机 器 可 以 有 效 地 解决 正则 表达 式 识 别 问题 )。 

对 于 任何 人 来 说 都 需要 先 对 一 个 解决 方案 进行 检查 才能 证 明 这 个 方案 是 有 效 的 。 就 我 们 的 
讨论 而 言 ， 我 们 可 以 将 一 个 不 确定 性 机 器 的 算法 看 作 “猜测 ”问题 的 解决 方案 ， 然 后 验证 这 个 
解决 方案 是 否 是 正确 的 。 在 图 灵机 中 不 确定 性 的 表示 非常 简单 ， 就 像 为 一 个 给 定 的 状态 和 一 个 
给 定 的 输入 定义 两 个 不 同 的 后 续 状 态 ， 然 后 将 解决 方案 表示 为 能 到 达 期 望 结 果 的 所 有 合法 路 径 。 
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例如 ,我 们 可 以 构建 一 个 不 确定 的 图 灵机 ， 这 个 图 灵机 通过 将 右 侧 展示 的 机 器 附加 到 一 
个 SAT 检查 器 的 头 上 来 解决 SAT 问题 ， 并 且 运 行 的 时 候 还 要 
执行 纸 带 初始 化 ， 这 是 为 了 将 SAT 实例 放 到 最 左 端的 纸 带头 1 
上 。 这 个 机 器 的 不 确定 部 分 用 来 简单 地 猜测 每 个 变量 的 正确 值 ， 
然后 把 解决 方案 放 在 纸 带 上 。 随 后 一 个 (确定 的 ) 像 练习 5.5.38 
中 的 SAT 检查 器 可 以 验证 这 个 答案 。 如 果 你 觉得 机 器 猜测 这 个 
想法 不 好 ， 那 么 你 可 以 这 样 思 考 不 确定 性 : 一 个 不 确定 的 机 器 
当 且 仅 当 存 在 某 条 路 径 可 以 让 机 器 从 开始 状态 到 一 个 Yes 状态 
时 ， 才 会 接受 输入 字符 串 。 在 这 种 情况 下 答案 是 明确 的 : 若 公 
式 成 立 ， 则 有 一 条 通过 不 确定 部 分 的 路 径 可 以 将 满足 题目 要 求 
的 值 写 在 纸 带 上 ， 一 条 通过 确定 部 分 的 路 径 可 以 到 达 Yes 状态 。 

假设 一 台 机 器 能 够 猜 出 答案 看 起 来 似乎 是 一 种 奢望 ， 但 是 
如 果 我 们 能 够 将 一 个 不 确定 的 图 灵机 转换 为 一 个 确定 的 机 器 ， : 
那么 这 个 想法 就 会 变 得 更 加 可 行 了 ， 就 像 我 们 在 前 文 对 NFA 做 
的 那样 。 最 终 我 们 得 到 的 结果 是 一 个 尝试 检查 所 有 2" 个 可 能 输 
入 值 的 确定 的 图 灵机 。 任 何在 NP 中 的 问题 都 可 以 在 指数 时 间 多 
内 解决 (通过 相同 的 推理 )。 问 题 的 关键 不 在 于 找到 答案 的 可 能 
性 ， 而 是 在 于 成 本 。 那 么 存在 一 个 能 在 多 项 式 时 间 内 找到 并 检 | 
查 解决 方案 的 确定 的 图 灵机 吗 ? 连接 到 

下 面 的 定义 与 我 们 介绍 的 定义 等 价 :“NP 是 所 有 能 在 不 确 SA 和 
定 图 灵机 上 在 多 项 式 时 间 内 解决 (并 检查 ) 的 问题 的 集合 。” 你、 解决 SAT 问题 的 不 确定 图 灵机 
接 下 来 就 会 看 到 这 种 表达 是 让 我 们 能 够 证 明 关于 NP 的 其 他 特性 的 一 个 必要 步骤 。 

“易于 解决 ”的 搜索 问题 。NP 的 定义 中 没有 说 明 找到 解决 方案 的 困难 之 处 ; 它 仅仅 描 
述 了 如 何 检查 提出 的 解决 方案 是 否 是 有 效 的 。 构 成 难 解 性 研究 基础 的 两 组 问题 中 的 第 二 个 问 
题 ， ss A 宫 与 于 失 村 淆 病 需 的 浴 席 有 
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对 于 在 P 中 的 问题 必定 存在 一 个 多 项 式 时 间 算法 以 解决 这 个 同 题 。 从 数学 的 角度 上 
来 说 ,“ 算 法 ”的 意思 是 “确定 的 图 灵机 ”,“ 多 项 式 时 间 ” 的 意思 是 “上 限 是 输入 纸 带 上 输 
入 位 数 的 一 个 多 项 式 函数 ”。“ 多 项 式 ” 这 个 词 并 没有 指定 任何 具体 细节 一 一 我 们 仅仅 是 用 
它 来 区 别 指数 时 间 ， 如 指数 时 间 算 法 定义 所 述 。 

对 于 某 一 个 问题 ， 如 果 我 们 能 写 出 一 个 在 多 项 式 时 间 内 解决 问题 的 Java 程序 ， 那 么 我 
们 认为 这 个 问题 在 P 中 。 排 序 问题 属于 P， 因 为 插入 排序 的 运行 时 间 与 x 成 正比 (我 们 这 
里 并 不 关心 是 否 有 更 快 的 排序 算法 )， 所 以 说 像 最 短路 径 算法 、 线 性 方程 求解 和 很 多 其 他 算 
法 都 是 属于 P 的 。 对 数 算法 、 线 性 算法 、 二 次 算法 和 三 次 算法 都 属于 多 项 式 时 间 算 法 ， 所 
以 这 个 定义 肯定 覆盖 了 目前 我 们 研究 的 经 典 算法 。 

对 于 一 个 搜索 问题 ， 找 到 一 个 有 效 算 法 来 解决 它 就 证 明了 它 属 于 P。 换 句 话 说，P 只 不 
过 是 对 于 一 类 问题 的 一 个 精确 描述 ， 这 类 问题 包括 所 有 能 够 被 科学 家 、 工 程 师 和 程序 员 用 程 
序 在 一 个 合适 的 时 间 内 完成 的 问题 。 在 后 文 ， 我 们 列 出 了 以 前 讨论 过 的 在 P 中 的 问题 。 

“难以 解决 ”的 搜索 问题 。 如 果 一 个 搜索 问题 不 在 P 中 ,我 们 便 知 道 没 有 多 项 式 时 间 算 
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法 能 解决 这 个 问题 。 我 们 使 用 “难以 解决 "(intractable) 这 个 词 来 形容 


kh 


这 样 的 问题 。 
ee 
pd pi 人 
如 果 一 个 问题 是 难以 解决 的 ， 我们 便 不 能 保证 可 以 在 一 个 合适 的 时 间 内 解决 这 个 问题 ， 
[837 除非 输入 的 规模 很 小 。 在 本 节 中 ， 我 们 将 会 遇 到 几 个 被 认为 是 难以 解决 的 著名 搜索 问题 。 
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多 项 式 时 
问题 输入 描述 i 实例 解决 方案 
5 人 
图 G 在 图 G 中 找到 一 个 从 A 
最 长 路 径 顶点 9、! s 到 t 长 度 大 于 或 等 于 ? 9 
整数 m  ”m 的 简单 路 径 (2 OP 
= 3™% 


找到 x 的 一 个 非 平凡 
质 | 
质 因 子 分 解 整数 x 子 ( 质 因子 ) ? 97605257271 8784561 





32 
子 集 求 和 整数 集合 找到 一 个 和 为 0 的 子 集 ? pk -44 
12 
y—x<]1 有 | 
整数 线性 nn 个 变量 对 变量 分 配 整 数值 ， Sx—2<2 有 
不 等 式 求解 ”“”m 个 不 等 式 、 使 得 所 有 不 等 式 被 满足 。 Ey Ef 
z 宇 0 
XxX+y=true X=true 
布尔 方程 组 n 个 变量 对 变量 分 配 true/ false Sid oe 
求解 m 个 方程 ” 值 ， 使 得 所 有 方程 被 满足 Hy 
xX+y'+2z' =true z= false 
这 些 问题 都 属于 PP 一 一 见 下 面 的 表格 
838 属于 NP 的 问题 示例 
问题 输入 描述 多 项 式 时 间 算 法 实例 解决 方案 
eg 1 全 
最 短路 径 t 度 小 于 或 等 于 部 BFS 0-3 
不 三 2 
乘法 两 个 整数 计算 它们 的 乘积 pg 8784561 123123 97605257271 
找到 一 个 从 小 
排序 可 比较 的 从 "的 排序 并 着 宇 -归并 排序 二 六 b 和 0 庆 Tinn 地 3530 全 1 
组 成 的 数组 a 
进 a 中 
对 每 个 变量 分 
入 6 二 二 
线性 方程 求解 ”全 程 。 配 值 ， 使 得 所 有 高 基 消 元 法 et Pe 
| 方程 被 满足 . 号 
4x—4y<3 
a 3 对 每 个 变量 分 e x=2 
本 值 ， 使 得 所 有 衫 球 算法 ect y=3/2 
2 不 等 式 被 满足 SE 9 区 
2 过 


839 属于 P 的 问题 实例 
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想象 一 下 ，20 世纪 中 叶 的 应 用 数学 家 (以 及 当时 为 数 不 多 的 计算 机 科学 家 ) 制定 了 这 些 
问题 类 别 ， 他 们 希望 通过 这 种 方式 来 找到 一 一 种 识别 难以 解决 的 问题 的 方法 ， 从 而 避免 研究 这 
些 问题 ， 就 像 我 们 对 无 法 解决 的 问题 所 做 的 那样 。 但 是 他 们 不 知道 ， 五 十 年 过 去 了 ,我 们 仍 
然 不 知道 是 否 能 够 找到 一 个 多 项 式 时 间 的 解法 。 

主要 问题 “不 确定 性 看 起 来 似乎 是 一 种 幻想 , 它 并 不 是 我 们 在 现实 世界 中 能 拥有 的 东 
西 ， 认 真 考虑 它 似 乎 是 一 件 荒 瓷 的 事情 。 虽 然 它 能 让 难题 变 得 微不足道 ， 但 是 我 们 要 不 要 花 
时 间 考 虑 一 个 虚无 绿 纵 的 工具 呢 ? 问题 的 答案 是 ， 虽 然 不 确定 性 看 起 来 似乎 很 强大 ， 但 是 没 
有 一 个 人 能 证 明 对 于 一 个 特定 的 搜索 问题 ， 一 个 不 确定 的 机 器 能 比 确定 的 机 器 要 快 ! 换 句 话 
说 ， 我 们 当然 想 知 道 哪些 搜索 问题 在 P 中 ， 哪 些 是 难以 处 理 的 ， 但 是 没有 人 找到 一 个 可 以 
被 证 明 是 在 NP 中 并 且 不 在 PP 中 的 问题 (其 至 不 能 证 明 这 个 问题 的 存在 )， 所 以 我 们 不 禁 思 
考 下 面 这 个 基本 问题 : 

Se 

S_Cook 在 1971 年 以 这 种 形式 精确 地 提出 了 这 个 问题 尽管 早 些 时 候 有 儿 个 研究 者 提出 
了 一 些 近 似 的 概念 ， 其 中 包括 由 库 尔 特 * 哥 德 尔 在 1956 年 写 给 冯 “' 诺 依 曼 的 著名 的 “丢失 
的 信件 ”( 还 有 1955 年 约翰 .纳什 给 国家 安全 局 (NSA) 的 信件 ， 这 封 信 在 2012 年 被 解密 )。 
这 个 问题 从 那 以 后 就 彻底 难 倒 了 数学 家 和 计算 机 科学 家 。 这 个 问题 的 其 他 提问 方式 揭示 了 它 
的 基本 人 性质: 

。 是 否 存在 一 些 难以 解决 的 搜索 问题 ? 

。 对 于 一 些 搜索 问题 ， 穷 举 法 真 的 是 最 好 的 方法 吗 ? 

。 寻找 解决 搜索 问题 的 方法 比 检查 解决 方案 是 否 有 效 更 难 吗 ? 

。 对 于 解决 一 些 搜索 问题 ， 在 不 确定 的 计算 设备 上 一 定 比 在 确定 的 计算 设备 上 更 有 

效 吗 ? 

无 法 知道 这 些 问 题 的 答案 是 一 件 令 人 泪 丧 的 事情 ， 因 为 有 许多 重要 的 实际 问题 属于 
NP, 但 是 可 能 属于 也 可 能 不 属于 P (已 知 的 最 优 求解 算法 是 指数 级 的 )。 如 果 我 们 可 以 证 明 
一 个 搜索 问题 是 难以 解决 的 (不 属于 P)， 那 么 我 们 可 以 放弃 寻找 一 个 有 效 的 解决 方案 。 在 没 
有 这 样 的 证 明 的 情况 下 ， 有 可 能 是 某 个 有 效 的 算法 未 被 我 们 发 现 。 事 实 上 ， 考 虑 到 我 们 当前 
的 知识 水 平 ，NP 中 的 每 一 个 问题 都 有 可 能 有 一 些 有 效 的 算法 ， 这 意味 着 有 很 多 有 效 的 算法 
都 未 被 发 现 。 我 们 生活 在 下 面 这 两 种 可 能 中 的 一 个 


PzNP P=NP 





有 一 些 搜索 问题 是 难以 解决 的 。 所 有 的 搜索 问题 都 是 可 以 解决 的 。 

对 于 某 些 搜索 问题 ， 穷 举 法 解决 方案 可 能 就 是 对 于 ILP、SAT、 分 解 问题 等 都 存在 有 效 算 
最 优 解 。 法 ， 并 且 所 有 问题 都 属于 NP。 

寻找 解决 搜索 问题 的 方法 比 检查 一 个 解决 方案 寻找 搜索 问题 的 解决 方案 和 检查 解决 方案 
是 否 有 效 更 难 。 是 否 有 效 的 难 易 程度 是 一 样 的 。 

不 确定 性 能 帮助 我 们 更 有 效 地 解决 搜索 问题 。 不 确定 性 不 会 对 我 们 解决 搜索 问题 产生 帮助 。 





NP 


(°) 难以 解决 的 问题 





”顶点 覆盖 问题 


492 沉 5 主 


但 是 我 们 并 不 知道 哪个 才 是 对 的 。 很 少 人 会 相信 P = NP， 而 且 人 们 已 经 付出 了 相当 多 


的 努力 来 证 明 P! = NP， 但 是 这 个 问题 仍然 是 计算 机 理论 中 
突出 的 开放 性 研究 问题 。 

多 项 式 时 间 归 约 ”进一步 了 解 P = NP? 问题 的 关键 
是 关于 多 项 式 时 间 归 约 (polynomial time reduction)。 回 
顾 二 下 5.4 节 ， 我 们 说 如 果 可 以 通过 执行 一 些 标准 的 计算 
步骤， 加 上 调用 一 些 用 于 解决 问题 B 的 子 程序 来 解决 任 
意 一 个 问题 A 的 实例 ， 那 么 我 们 就 可 以 将 问题 A 归 约 成 
问题 B。 在 本 节 内 容 中 ， 我们 限制 了 子 程 序 的 调用 次 数 并 
将 子 程序 之 外 的 执行 时 间 限 制 在 输入 大 小 的 多 项 式 时 间 范 
围 内 。 因 此 ， 如 果 问 题 A 能 在 多 项 式 时 间 内 归 约 为 问题 
B (并 且 我 们 可 以 在 多 项 式 时 间 内 求解 B)， 那 么 我 们 就 能 
在 多 项 式 时 间 内 求解 A。 这 种 简化 被 称 为 库 克 归 约 ( Cook 
reduction)， 而 卡尔 普 归 约 (Karp reduction) 则 更 为 严格 。 
但 是 ， 这 两 个 我 们 得 出 的 一 般 结论 对 于 这 两 种 定义 都 是 成 


立 的 。 


我 们 所 有 的 证 明 都 


只 使 用 B 中 的 一 个 实例 ， 如 5.4 节 所 述 ， 但 是 理论 上 来 说 我 们 可 以 使 













处 理 a 并 创建 B ”| 
的 实例 b,，b,… | 


B 中 的 实例 b.; b,， 
… 的 多 项 式 个 数 














处理 5 ，b,… 的 解决 方案 
| 来 帮助 计算 a 的 解决 方案 








a 的 解决 方案 
多 项 式 时 间 归 约 


了 


用 多 项 式 数量 个 实例 ， 只 要 将 所 有 对 A 的 输入 转化 为 对 B 的 输入 ， 以 及 将 B 的 解决 方案 转 
化 为 A 的 解决 方案 (和 所 有 其 他 的 东西 ) 仍然 是 在 多 项 式 时 间 界 限 内 即 可 。 

如 果 问 题 A 能 在 多 项 式 时 间 内 归 约 成 问题 B， 那 么 就 可 以 通过 B 的 一 个 多 项 式 时 间 算 
法 产生 一 个 A 的 多 项 式 时 间 算 法 。 这 是 从 软件 开发 得 出 来 的 一 个 令 人 熟悉 的 概念 : 当 你 调 


CC DD) 
找到 包含 所 有 2 





边 且 顶点 数 小 于 A) 
或 等 于 2 的 顶点 
(8) \E) 是 一 个 例子 。 
0/1 ILP 的 表示 2 
+ 之 1 
找到 满足 不 等 式 的 。 六 i ， 
w 的 0 从 路 汪 到 三 1 
xc+ 知 三 1 
0/1 ILP 的 解决 方案 
二 1 XA 二 1 
Xs = 0 Xs = 0 
和 = 1 xc= 0 
XD = 0 Xp = 1 
3 三 0 Xp= 0 
顶点 覆盖 问题 的 解决 方案 
fAG AD 


将 项 点 覆盖 问题 归 约 为 0/1 ILP 


用 一 个 库 函 数 来 解决 问题 的 时 候 ， 你 就 在 把 你 的 问题 归 约 
成 一 个 调用 库 函 数 能 解决 的 问题 ， 而 这 通常 是 多 项 式 时间 
的 。 有 一 些 问题 很 重要 ， 因 为 它们 证 明了 很 多 多 项 式 时 间 
归 约 是 可 行 的 ， 即 使 是 一 些 看 起 来 并 不 相似 的 问题 。 下 面 
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一 般 来 说 ， 可 满足 性 问题 允许 进行 许多 这 样 的 归 约 。 这 就 是 为 什么 这 些 问 题 的 求解 器 被 
广泛 地 用 于 实际 中 ， 以 及 为 什么 它们 是 否 属于 P 这 个 问题 如 此 重要 。 这 个 归 约 并 没有 带 给 
我 们 一 个 能 解决 顶点 尾 盖 问题 的 多 项 式 时 间 算 法 ,但 是 它 建 立 了 这 些 问题 之 间 的 关系 。 这 些 
关系 是 难 解 性 理论 的 基础 。 

为 了 检查 一 下 你 是 不 是 真 的 理解 了 怎么 使 用 归 约 ， 请 你 花 时 间 说 服 自己 下 面 三 个 事实 是 
真 的 : 

。 如 果 A 能 在 多 项 式 时 间 内 归 约 成 B 且 B 属于 P， 则 A 也 属于 P。 

。 任何 属于 P 的 问题 都 可 以 归 约 成 其 他 任何 问题 。 

。 多项式 时 间 的 归 约 具有 传递 性 : 如 果 A 能 在 多 项 式 时 间 内 归 约 成 B， 且 B 能 在 多 项 

式 时 间 内 归 约 成 C， 则 A 能 在 多 项 式 时 间 内 归 约 成 C。 

第 一 个 问题 很 容易 通过 统计 解决 A 的 成 本 来 证 明 。 第 二 个 问题 是 一 种 空虚 的 真 ( 无 法 找 
到 这 样 的 实例 )。 例 如 ， 排 序 问 题 可 以 归 约 成 停机 问题 ， 因此， 如 果 我 们 可 以 在 多 项 式 时 间 
内 解决 停机 问题 ， 那 么 我 们 就 可 以 在 多 项 式 时 间 内 解决 排序 问题 。 虽 然 我 们 已 经 可 以 在 多 项 
式 时 间 内 进行 排序 了 ， 但 是 这 与 我 们 是 否 能 解决 停机 问题 是 完全 无 关 的 。 我 们 将 归 约 的 传递 
性 的 证 明 留 作 练习 ( 见 练习 5.5.30 ) 。 

NP 完全 性 ”我们 已 经 知道 有 很 多 问题 属于 NP， 但 是 我 们 不 知道 这 些 问题 是 否 属于 P。 
也 就 是 说 ， 我 们 可 以 很 容易 地 检查 任何 给 定 的 解决 方案 是 否 有 效 ， 但 是 ， 尽 管 付 出 了 相当 大 
的 努力 ， 没 有 人 能 找到 一 种 可 以 用 于 寻找 解决 方案 的 有 效 算 法 。 值 得 注意 的 是 这 些 问 题 都 有 
一 个 额外 的 属性 ， 即 它们 能 提供 令 人 信服 的 证 据 证 明 它 们 都 是 难以 解决 的 ， 并且 可 以 证 明 
P 关 NP。 为 了 研究 这 一 现象 ， 我们 定义 如 下 属性 : 


a 








B 是 NP 完全 的 。 
这 是 一 个 非常 强大 的 命题 。 也 就 是 说 ， 如 果 一 个 问题 是 NP 完全 的 ， 那么 一 旦 找到 一 
个 能 解决 这 个 问题 的 多 项 式 时 间 算 法 就 意味 着 我 们 能 在 多 项 式 时 间 内 解决 所 有 属于 NP 的 问 
题 二 一 NP 会 等 我 Ps 

这 个 定义 让 我 们 能 够 把 对 “困难 ”的 定义 提升 到 “难以 处 理 ， 除 非 P = NP”。 如 此 ， 
NP 完全 问题 是 最 难 的 搜索 问题 。 如 果 任 何 一 个 NP 完全 问题 可 以 在 多 项 式 时 间 内 求解 ， 那 
么 NP 中 的 所 有 问题 都 可 以 (换言之 ,， P = NP)。 也 就 是 说 ,研究 人 员 试 图 为 所 有 的 这 些 问 
题 找到 有 效 的 算法 ， 但 是 他 们 都 失败 了 ， 而 他 们 的 集体 失败 可 能 会 被 看 作证 明 P = NP 的 集 
体 失败 。 

在 你 看 来 NP 完全 似乎 是 一 个 幻想 (就 像 非 确定 性 )， 但 是 ， 正 如 你 将 会 看 到 的 那样 ， 
我 们 能 够 证 明 实 际 出 现 的 所 有 搜索 问题 都 属于 P 或 者 NP 完全。 大 部 分 的 研究 者 都 认为 
P 闭 NP， 如 果 能 证 明 一 个 问题 是 NP 完全 的 ， 那 么 就 意味 着 这 个 问题 是 难以 解决 的 ， 于 是 
这 些 研究 者 就 会 放弃 为 这 个 问题 寻找 一 个 多 项 式 时 间 算 法 。 

我 们 仍然 生活 在 两 个 可 能 中 的 一 个 ， 但 至 少 我 们 知道 问题 的 关键 在 哪 。 如 果 一 个 问题 是 
NP 完全 的 ， 那 么 认为 它 难以 处 理 是 合理 的 。 
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PNP P=NP 
NP 完全 问题 是 难以 解决 的 所 有 搜索 问题 都 是 可 以 解决 的 


NP 


@Ce Cm 


两 种 可 能 ( 另 一 角度 ) 


证 明 问题 是 NP 完全 的 与 难 解 性 一 样 ， 如 果 我 们 不 知道 哪个 问题 是 NP 完全 的 ， 那 
么 NP 完全 性 的 概念 就 没有 任何 作用 。 但 这 正 是 它们 的 区 别 ! 我 们 知道 很 多 自然 界 中 的 问 
题 是 NP 完全 的 ， 而 且 我 们 有 一 个 相对 直接 的 方式 来 分 辨 新 问题 是 否 是 NP 完全 的 。 这 个 
情况 与 我 们 看 到 的 可 计算 性 相同 ( 见 5.4 节 )。 困 难 的 部 分 是 证 明 第 一 个 这 样 的 问题 是 NP 
完全 的 。 









这 个 证 明 是 由 史蒂芬 * 库 克 和 莱 昂 纳 德 ， 莱 维 在 20 世纪 70 年 代 初 期 分 别 完成 的 。 库 
克 的 论文 在 向 人 们 介绍 NP 完全 性 的 概念 方面 具有 极 大 的 影响 力 ， 但 是 莱 维 的 结果 出 现 得 较 
早 ， 所 以 习惯 上 我 们 把 二 者 结合 起 来 讨论 。 这 个 证 明 进 一 步 的 细节 超出 了 本 书 的 范围 ， 但 是 
你 可 以 在 以 后 的 计算 机 科学 课程 中 学 到 。 在 目前 的 学 习 中 ， 我 们 只 需要 知道 有 这 样 一 个 证 明 
就 足够 了 。 2 

”就 像 停 机 问题 的 不 可 解决 性 一 样 ， 布 尔 可 满足 性 问题 虽然 非常 有 趣 ， 但 也 是 不 能 够 以 多 
项 式 时 间 解 决 的 。 布尔 可 满足 问题 的 NP 完全 性 实在 太 重要 了 ， 因 为 我 们 可 以 用 它 来 证 明 其 
他 重要 问题 是 不 可 解决 的 。 






我 们 首先 将 问题 A 看 成 布尔 可 满足 性 问题 。 如 果 我 们 证 明 布尔 可 满足 性 问题 可 以 在 多 
项 式 时 间 内 归 约 为 问题 B， 那 么 我 们 就 已 经 证 明 NP 中 的 任何 问题 都 能 归 约 为 B。 换 句 话 
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说 ,问题 B 是 NP 完全 的 。 

卡尔 善 归 约 。1972 年 ， 理 查 德 . 卡尔 普 (Richard Karp) 用 这 种 方式 展示 了 由 布尔 可 
满足 性 到 21 个 众所周知 难以 解决 的 问题 的 归 约 过 程 。 作 为 一 个 例子 ,我 们 再 次 考虑 0/1 
IEP。 





845 


布尔 可 满足 性 问题 左 图 给 出 了 这 种 构造 方式 的 一 个 例子 。 请 


pe eS (x'+2)(x+y'+2)(x+y)(x'+y') 注意 ， 我 们 将 项 点 覆盖 问 题 归 约 为 0/1 ILP 问 

Eo eh 题 (命题 C) 并 不 会 产生 顶点 履 盖 问题 是 NP 完 
nr 全 的 这 样 的 结论 ， 因 为 我 们 还 没有 证 明 顶 点 覆 

找到 满足 式 子 的 Xty'+z = true 盖 问 题 是 NP 完全 的 。 但 是 我 们 可 以 用 0/1 ILP 

PN 问题 的 NP 完全 性 来 证 明 ILP 问题 是 NP 完 
0/1 ILP 的 表达 全 的 。 

HU=WT ee 
找到 满足 式 子 的 x (l= 1 
x、y、z 的 0/1 值 x+y 宇 1 


(1-x)+(1-y) > 
04 于 P 的 解决 方案 
x=0 


x=1 

yl y=0 
Zz=1。 z=1 
布尔 可 满足 性 的 解决 方案 


X= false X=true 
y=true y=false, 
z=true Ze 


将 布尔 可 满足 性 归 约 为 0/1 ILP 


综 上 所 述 : 一 个 解决 ILP 问题 的 多 需 趟 时 间 算 法 可 以 给 出 0/1 ILP 问题 振 多 需 站 时 
间 算 法 ， 而 0/1 ILP 问题 的 多 项 式 时 间 算 法 又 会 给 出 布尔 可 满足 性 问题 的 多 项 式 时 间 算 
法 ,布尔 可 满足 性 问题 的 多 项 式 时 间 算 法 可 以 给 出 所 有 属于 NP 问题 的 多 项 式 时 间 算 法 
(P = NP)。 在 卡尔 普 的 论文 和 库 克 -- 莱 维 定理 出 现 之 前 ， 人 们 知道 ILP (作为 例子 ) 是 
困难 的 ,但 是 他 们 不 知道 由 一 个 多 项 式 时 间 算 法 给 出 所 有 搜索 问题 的 多 项 式 时 间 算 法 如 
此 困难 。 
现在 你 已 经 知道 三 个 NP 完全 问题 ， 并 且 可 以 通过 归 约 它们 中 的 任何 一 个 来 找到 另 一 个 
NP 完全 问题 。 你 可 能 会 看 到 这 些 已 知 的 NP 完全 问题 如 何 迅 速 扩张 。 
卡尔 普 1972 年 的 论文 《 Reducibility Among Combinatorial Problems 》 中 提 到 的 这 个 问 
题 我 们 将 在 后 文 描述 ， 他 对 归 约 的 证 明 会 在 下 图 展示 ， 其 中 从 问题 A 到 问题 B 的 箭头 表示 
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在 论文 中 已 经 证 明了 可 以 从 A 到 B 进行 多 项 式 时 间 的 归 约 。 请 注意 ,顶点 改 盖 问题 也 在 其 
中 ， 从 SAT 到 CLIQUE 的 归 约 和 从 CLIQUE 到 VERTEX COVER (顶点 覆盖 ) 的 归 约 都 被 
证 明 是 NP 完全 的 。 图 中 的 蓝 色 箭头 阐述 了 库 克 一 莱 维 定理 的 含义 ， 它 向 我 们 强调 所 有 问题 
都 是 NP 完全 的 。 这 篇 论文 有 很 大 的 影响 力 ， 因 为 这 是 一 个 明确 的 陈述 ， 如 果 所 有 这 些 问 题 
都 有 多 项 式 时 间 算 法 ， 那么 P = NP。 人 们 对 于 这 些 问 题 的 困难 之 处 各 有 看 法 ， 但 是 事实 上 
它们 都 非常 困难 ， 并 且 其 中 的 任何 一 个 问题 的 有 效 算法 都 意味 着 是 对 所 有 问题 的 有 效 算法 的 
一 个 启示 。 从 此 人 们 意识 到 为 这 些 问 题 寻找 多 项 式 时 间 算 法 是 没有 意义 的 ， 有 许多 研究 人 员 
已 经 花 了 很 多 年 时 间 去 试图 解决 这 些 问 题 。 





库 克 - 莱 维 - 卡尔 普 归 约 


南 塌 式 发 展 。 自 卡尔 普 发 表 论 文 后 的 几 十 年 来 ， 研 究 人 员 已 经 通过 这 种 归 约 关系 在 各 种 

各 样 的 领域 发 现 了 数 以 万 计 的 问题 。 在 下 面 的 表格 中 列 出 了 其 中 一 些 例子 。 显 然 ， 与 不 可 解 

决 性 相反 ,已 知 的 NP 完全 问题 的 数量 正在 迅速 增加 。 每 年 都 有 数 千 篇 关于 这 个 话题 的 科学 

论文 被 发 表 出 来 。 正 因为 有 这 么 多 学 科 在 这 方面 有 如 此 多 的 科学 问题 ，P = NP ? 毫 无 疑问 
[8&47 是 我 们 这 个 时 代 最 重要 的 开放 性 科学 问题 之 一 。 


问题 简洁 描述 
布尔 可 满足 性 同时 求解 一 些 布尔 方程 

(SAT) 

3-SAT 同时 求解 一 些 布尔 方程 ， 一 条 方程 最 多 有 三 个 变量 

0/1 ILP 同时 求解 线性 不 等 式 ， 并 且 取 值 限制 在 0/1 

团 找到 一 个 至 少 有 mn 个 顶点 的 完全 子 图 

集合 的 包 从 给 定 列表 中 找 出 m 个 或 者 更 少 的 成 对 不 相交 的 子 集 

项 点 条 六 寻找 由 个 或 者 更 少 的 顶点 使 得 这 些 顶点 能 接触 图 中 的 所 有 边 

集合 覆盖 在 一 个 给 定 的 列表 中 寻找 m 个 或 者 更 少 的 5 的 子 集 ， 使 得 它们 的 并 集 是 8 
反馈 顶点 集合 在 一 个 图 中 寻找 至 多 mm 个 顶点 ,将 这 些 顶 点 全 部 移 除 后 图 中 不 存在 环 


卡尔 普 的 NP 完全 问题 的 简洁 描述 (表达 为 搜索 问题 ) 
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反馈 边 集 合 在 一 个 图 中 寻找 至 多 m 条 边 ， 将 这 些 边 全 部 移 除 后 图 中 不 存在 环 
施 泰 纳 树 用 总 长 不 超过 m 的 直线 连接 一 个 集合 中 的 所 有 点 ， 并 且 人 允许 不 在 原始 集中 额外 的 “ 施 泰 纳 点 ”存在 
有 向 哈密 顿 问 路 在 一 个 有 向 图 中 找到 一 个 有 向 循环 ， 使 得 每 个 顶点 都 被 经 过 一 次 
哈密 顿 回路 在 一 个 图 中 找到 一 个 回路 ， 使 每 个 顶点 都 被 经 过 一 次 
图 着 色 使 用 m 种 或 者 更 少 的 颜色 为 图 中 的 每 个 顶点 着 色 ， 并 且 每 条 边 连接 的 两 个 顶点 颜色 不 同 
团 覆 盖 将 一 个 图 分 成 m 个 或 更 少 的 团 ， 或 者 报告 不 可 能 
精确 覆盖 从 给 定 列表 中 找 出 至 多 闫 个 8 的 子 集 ， 使 得 每 个 8 的 成 员 在 且 仅 在 一 个 子 集中 ， 或 者 报告 不 可 能 
命中 集合 寻找 一 个 包含 至 多 m 个 元 素 的 5 的 子 集 ， 其 中 包含 给 定 列表 中 的 每 个 子 集 的 至 少 一 个 元 素 
三 维 匹配 给 定 一 个 三 元 组 的 集合 ， 其 中 每 个 三 元 组 的 元 素 都 来 自 三 个 不 相交 的 集合 ， 
找到 一 个 子 集 使 得 没有 一 个 元 素 出 现在 两 个 三 元 组 中 
背包 ， 与 我 们 对 子 集 求 和 问题 的 描述 相同 
作业 车 间 调 度 在 两 个 处 理 器 上 对 一 组 作业 进行 调度 ， 使 得 在 指定 的 时 间 m 内 将 所 有 作业 完成 
分 块 将 一 个 整数 集合 分 成 两 个 和 相等 的 子 集 
最 大 分 割 找到 一 个 最 多 有 m 条 边 的 集合 将 图 分 割 为 不 相交 的 两 块 
卡尔 普 的 NP 完全 问题 的 简洁 描述 (表达 为 搜索 问题 )( 续 ) 848 
研究 领域 典型 NP 完全 问题 
航天 工程 有 限 元 素 的 最 优 网 格 划 分 
发 展 重 构 
化 学 工程 热 交 换 网 络 合成 
化 学 蛋白 质 折 炙 
土木 工程 城市 交通 流量 均衡 
计算 机 设计 VLSI 布局 
经 济 学 金融 市 场 摩擦 的 仲裁 
环境 科学 污染 物 传感器 的 最 佳 位 置 
金融 工程 最 大 限度 减 小 投资 风险 
博弈 论 使 社会 福利 最 大 化 的 纳什 均衡 
基因 组 学 基因 重 构 
机 械 工程 剪 切 流 中 的 满 流 结构 
双 辟 心血 管 的 图 像 重 构 
行为 调查 旅游 销售 人 员 、 整 数 编程 等 
物理 学 三 维 易 辛 模型 的 分 区 功能 
政治 学 Shapley-Shubik 投票 理论 
热门 文化 数 独 、 跳 棋 、 扫 雷 、 俄 罗斯 方块 
统计 学 最 佳 的 实验 设计 
NP 完全 问题 的 例子 849 


尽管 NP 完全 理论 没有 提供 任何 可 以 证 明 这 些 问 题 是 难处 理 的 证 据 ， 但 是 它 还 是 有 


着 很 深远 的 影响 ; 它 将 任何 一 个 对 于 这 些 问题 的 多 项 式 时 间 算 法 发 展 成 为 与 证 明 P = NP 
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等 价 的 问题 。 它 们 是 同一 个 问题 的 不 同 表现 形式 ! 寻找 一 个 有 效 的 (多 项 式 时 间 ) 算法 
来 进行 基因 重 构 ， 或 者 设计 一 个 计算 机 芯片 来 使 得 投资 组 合 的 风险 最 小 ， 就 等 于 是 要 证 
明 P=NP。 

应 对 NP 完全 性 ”与 可 计算 性 一 样 ，NP 完全 是 当今 世界 不 可 避免 的 问题 。 正 如 我 们 在 
讨论 可 计算 性 时 提出 的 那样 ， 如 同 我 们 在 5.4 节 和 本 节 中 看 到 的 很 多 例子 ， 只 有 自己 亲身 
参与 过 计算 的 人 才 会 倾向 于 认为 我 们 可 以 用 一 台 足 够 强大 的 计算 机 做 任何 事 ， 这 个 假设 毫 
无 疑问 是 错误 的 。 那 些 不 了 解 NP 完全 的 人 注定 会 遇 到 令 人 泪 丧 的 体验 ， 即 他 们 试图 为 一 个 
已 经 被 证 明 (或 者 容易 被 证 明 ) 为 NP 完全 的 问题 开发 一 个 算法 , 但 是 他 们 却 不 知道 这 样 的 
算法 将 会 是 一 个 著名 的 开放 性 问题 的 解决 方案 。 如 果 你 需要 应 对 NP 完全 的 问题 ,那么 你 首 
先 要 理解 一 个 给 定 的 问题 是 如 何 被 分 类 的 ， 然 后 在 实践 中 采取 适当 的 策略 来 解决 这 个 问题 。 





不 知道 是 五 难 解 知道 是 难 解 问题 
` 知 道 是 否 难 解 二 
太 SAL 1 
1$ ; 
= gg 总 
< 8 乡 | A 

“I CANT Some I - 1 GUess TH SoST To DUHB.” ™ CANT Goes \T - Bar NETIMSK Chal AL THESE FRnous peopuE 1 

经 Nokia 公司 许可 转载 


难 解 性 理论 的 一 个 实际 用 处 


问题 的 分 类 。 在 实践 中 ,我 们 的 优势 在 于 面临 一 个 新 的 问题 时 ， 我 们 可 以 在 两 个 选择 中 
选择 一 个 : 

。 证明 这 个 问题 属于 P。 

。 证 明 这 个 问题 是 NP 完全 的 。 

虽然 还 有 其 他 的 选择 ,但 是 除了 这 个 问题 不 是 搜索 问题 或 者 这 个 问题 是 无 法 解决 的 ， 你 
在 实践 过 程 中 是 不 可 能 遇 到 其 他 选择 的 (请 参考 本 节 问 答 环节 )。 

为 了 证 明 一 个 问题 属于 P， 我 们 需要 找到 一 个 多 项 式 时 间 算 法 来 解决 这 个 问题 ， 也 许可 
以 通过 多 项 式 时 间 将 其 归 约 为 一 个 已 知 属 于 P 的 问题 。 这 个 过 程 与 编写 使 用 现 有 库 的 Java 
程序 没有 区 别 一 一 如 果 已 知 问题 可 以 在 多 项 式 时 间 内 执行 ， 那 么 客户 程序 也 可 以 在 多 项 式 时 
间 内 执行 。 一 旦 我 们 知道 一 个 问题 属于 P， 我 们 就 可 以 开发 改进 的 算法 ， 正 如 我 们 在 书 中 对 
许多 问题 所 做 的 那样 。 

为 了 证 明 一 个 问题 是 NP 完全 的 ， 我 们 需要 证 明 这 个 问题 属于 NP， 并 且 某 个 已 知 的 
NP 完全 问题 可 以 在 多 项 式 时 间 内 归 约 成 它 。 也 就 是 说 ， 新 间 题 的 一 个 多 项 式 时 间 算 法 可 以 
用 来 解决 NP 完全 问题 ， 而 这 个 NP 完全 问题 的 解决 方案 又 可 以 用 来 解决 所 有 属于 NP 的 问 
题 。 我 们 已 知 的 成 千 上 万 个 被 证 明 是 NP 完全 的 问题 都 是 从 一 个 已 知 是 NP 完全 的 问题 归 约 
得 到 的 ， 就 像 我 们 在 命题 E 中 对 0/1 ILP 和 命题 F 中 对 ILP 所 做 的 那样 。 

从 实际 的 角度 来 看 ， 将 问题 分 类 为 易于 解决 (P) 和 难以 解决 (NP 完全 ) 的 过 程 如 下 : 

。 直截了当 的 。 例 如 ， 插 入 排序 证 明 排 序 算法 是 属于 P 的 。 

。 棘手 但 是 不 困难 : 例如 , 证 明 O/1ILP 是 NP 完 全 的 (命题 E) 需要 一 些 经 验 和 实践 ， 
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但 是 很 容易 理解 。 
。 极 具 挑战 性 。 例如， 线性 规划 在 20 世纪 80 年 代 被 证 明 属于 P 之 前 长 期 处 于 未 被 分 


。 开放 性 。 例 如 ， 图 同 构 (给 定 两 个 图 ， 找 到 一 个 方法 来 对 其 中 一 个 图 的 顶点 进行 重 命 
名 ,使 得 两 个 图 相同 ) 和 因 式 分 解 问题 (给 定 一 个 整数 ， 找 到 一 个 非 平凡 的 因数 分 解 
式 ) 仍然 是 未 被 分 类 的 。 

这 是 目前 研究 的 一 个 丰富 且 活 路 的 领域 ,每 年 都 有 数 千 篇 研究 论文 。 正 如 在 前 面 表 
格 中 指出 的 那样 ， 科 学 探究 的 所 有 领域 都 与 之 有 关联 。 回 想 一 下 ,我们 对 NP 的 定义 涵盖 
了 科学 家 、 工 程 师 和 应 用 程序 员 都 希望 能 够 切实 解决 的 问题 一 一 当然 所 有 这 些 问 题 都 需要 
分 类 ! 

解决 NP 完全 问题 的 策略 。 面 对 如 此 广泛 的 问题 ， 人 们 必须 要 取得 一 些 进 展 ， 所 以 人 们 
投入 了 很 多 精力 以 想 办 法 解决 这 些 问题 。 难 解 性 理论 告诉 我 们 ， 世 界 上 存在 着 很 多 重要 问 
题 ， 我 们 不 能 合理 地 期 望 找 到 一 个 算法 以 同时 满足 下 面 三 个 属性 : 

。 保证 用 最 优 的 方式 解决 这 个 问题 (针对 优化 问题 )。 

。 保证 在 多 项 式 时 间 内 解决 问题 。 

。 保证 解决 这 个 问题 的 任何 实例 。 

因此 ， 当 我 们 遇 到 NP 完全 问题 时 ， 我 们 必须 至 少 放弃 这 三 个 要 求 中 的 一 个 。 我 们 不 可 
能 在 短 短 的 几 个 段落 之 内 对 如 此 广阔 的 领域 做 出 准确 而 公正 的 评论 ， 但 是 我 们 简要 地 描述 了 
两 种 成 功 的 方法 。 

近似 (Approximate): 放宽 最 优 性 要 求 等 于 改变 问题 并 开发 一 种 近似 算法 (approximation 
algorithm )， 这 个 算法 不 一 定 是 最 好 的 解决 方案 ， 但 是 我 们 能 保证 这 种 算法 接近 最 好 的 解决 
方案 。 例 如 ， 我 们 可 以 很 容易 地 找到 顶点 覆盖 问题 的 优化 版 本 的 解决 方案 ， 它 的 代价 在 最 
优 方 案 的 两 倍 的 范围 内 ( 见 练习 5.5.41 )。 设 计 近 似 算法 是 一 个 活路 的 研究 领域 。 不 幸 的 是 ， 
当 我 们 对 近似 算法 做 进一步 的 改进 时 会 发 现 ， 这 种 方法 通常 是 无 效 的 ， 它 仍然 没有 办 法 回避 
NP 完全 问题 。 例 如 ， 我 们 不 可 能 找到 这 样 的 一 种 情况 ， 对 于 一 个 特定 问题 ， 如 果 你 能 找到 
一 个 近似 算法 来 保证 它 的 结果 能 够 确保 在 最 优 性 能 两 倍 范围 内 ， 那 么 P= NP。 设 计 这 种 NP 
完全 问题 的 近似 算法 是 不 可 能 的 ， 除 非 P = NP。 

忽略 最 坏 情况 后 的 性 能 保证 ( Ignore the worst-case performance guarantees) : 放宽 其 他 
两 个 要 求 之 一 就 是 开发 一 种 算法 ， 这 种 算法 可 以 有 效 地 解决 在 实际 中 出 现 的 典型 情况 ， 即 使 
这 种 算法 存在 最 坏 输入 情况 下 找 不 到 解决 方案 的 可 能 。 在 这 种 情况 下 ， 我 们 不 再 保证 问题 的 
任何 输入 都 能 在 多 项 式 时 间 内 被 解决 ， 而 是 保证 对 于 实际 到 达 这 个 问题 的 输入 都 可 以 用 多 项 
式 时 间 来 解决 。 同 时 ， 我 们 也 不 再 保证 这 个 算法 可 以 解决 问题 的 任意 实例 ， 而 是 让 程序 知 
道 这 个 问题 的 哪些 实例 需要 用 指数 级 时 间 来 解决 。 在 现代 工业 应 用 中 经 常 使 用 SAT、ILP 和 
其 他 NP 完全 问题 的 解决 器 来 解决 出 现 的 巨大 问题 。 我 们 会 对 让 一 个 求解 器 运行 缓慢 的 具体 
问题 进行 深入 研究 ， 直 到 找到 一 些 成 功 的 方法 来 处 理 它们 。 接 下 来 我 们 将 讨论 SAT 的 这 种 
办 法 6 

布尔 可 满足 性 。 为 了 给 本 节 做 一 个 总 结 ， 我 们 将 开发 一 个 算法 来 解决 著名 的 SAT 问题 
的 实例 。 我 们 这 样 做 可 以 让 你 对 计算 机 科学 领域 的 研究 人 员 几 十 年 来 一 直 在 争论 的 一 个 非常 
重要 的 问题 有 所 了 解 。 我 们 是 否 应 该 将 SAT 看 作 一 个 易于 解决 的 问题 ? 

开始 之 前 ， 我 们 需要 有 一 些 用 于 表示 问题 实例 和 潜在 解决 方案 的 约定 。 我 们 用 m 表示 
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方程 式 的 数量 ， 用 n 表示 变量 的 数量 。 为 了 表示 一 个 解决 方案 ,我 们 使 用 了 一 个 长 度 为 m 
的 布尔 型 数组 inSubset[]， 它 表示 了 赋值 为 true 的 变量 的 子 集 。 为 了 表示 一 i 

个 问题 实例 ， 我 们 使 用 右 侧 展 示 的 紧凑 编码 。 我 们 将 每 个 方程 表示 为 含有 i 

n 个 字符 的 字符 串 ， 其 中 字符 串 中 的 第 i 个 字符 对 应 于 第 i 个 变量 ， 如 果 变 i 
量 出 现在 〈 非 否定 ) 方程 中 ， 则 为 “+”， 如 果 变 量 出 现在 (否定 ) 方程 中 ， x+y=true 

则 为 “-”， 如 果 变 量 没 有 出 现在 方程 中 ， 则 为 “.”。 因 此 ， 每 个 问题 实例 Ly ee 


都 可 以 用 一 个 包含 m 个 字符 串 的 数组 clauses[] 来 表示 。 答 入 格 广 ， 
通过 这 种 表示 形式 ， 我们 很 容易 就 能 检查 一 个 给 定 的 解决 方案 一 . 十 
inSubset[] 是 否 满足 所 有 方程 : i 
站、 


public static boolean check(String[] clauses, boolean[] inSubset) 
{ 


boolean product = true; SAT 表示 
for (int i = 0; i < clauses.length; i++) 


boolean sum = false; 
for (int j = 0; j < inSubset.length; j++) 


if (clauses[i].charAt(j) == '+') sum = sum || inSubset[j]; 
if (clauses[i].charAt(j) == '-') sum = sum || !inSubset[j]; 


二 
product = product && sum; 


return product; 


代码 中 的 check() 函数 可 以 在 与 问题 大 小 成 线性 的 时 间 内 完成 ， 因 此 我 们 可 以 确定 SAT 

853| 属于 NP。 它 也 是 我 们 接 下 来 描述 的 SAT 求解 器 中 的 关键 子 程序 。 

为 了 找到 一 个 SAT 实例 的 解决 方案 ， 我们 可 以 枚 举 所 有 2" 个 可 能 的 赋值 ， 然 后 使 用 
check() 函数 来 识别 哪 种 赋值 方式 满足 所 有 等 式 。SAT (程序 5.5.1 ) 通过 对 inSubset[] 数组 中 
所 有 可 能 的 赋值 进行 “计数 ”来 完成 这 个 操作 ， 其 中 false 对 应 0，true 对 应 1， 整 个 数组 对 
应 一 个 二 进 制 数 ( 见 “ 子 集 和 问题 的 一 个 示例 ”图 表 )。 为 了 强调 即使 是 对 于 图 灵机 这 也 是 
一 个 简单 的 计算 ，SAT 中 next() 方法 使 用 的 算法 与 我 们 在 增 量 图 灵机 中 使 用 的 算法 相同 ， 采 
用 这 种 算法 对 inSubset[] 进行 “递增 ”来 得 到 下 一 个 值 的 集合 : 从 右 侧 开始 扫描 ， 将 false 的 
值 改 为 ttue， 直 到 遇 到 一 个 true 并 将 它 改 成 false。 如 果 没 有 找到 true， 算 法 终止 ， 在 这 种 情 
况 下 next() 函数 返回 false ; 否则 它 返 回 true。 构 造 方法 通过 调用 next() 函数 来 精心 推断 计算 
下 一 个 解决 方案 ,通过 调用 check() 来 检查 是 否 确实 是 一 个 解决 方案 ， 持 续 运 行 直 到 next() 
返回 false。main() 函数 从 指定 为 命令 行 参 数 的 文件 中 读 取 数据 ， 并 创建 一 个 SAT 对 象 来 解 
决 可 以 满足 的 实例 。 


public static void main(String[] args) 
{ 
String filename = args[0]; 
In in = new In(filename); 
String[] clauses = in,.readAllStringsQO; 
SAT solver = new SAT(clauses); 


StdOut.printin(solver); 
} 


这 是 一 个 经 典 而 且 基 本 的 编程 练习 ， 还 有 很 多 其 他 的 可 行 方法 ， 这 些 方法 都 与 我 们 在 本 

书 其 他 地 方 介 绍 过 的 话题 相关 。 这 些 实现 是 相当 有 趣 的 ， 它 们 之 中 没有 一 个 与 前 文 讲 到 的 计 

算 理论 存在 差异 ， 所 以 我 们 只 在 练习 中 描述 其 中 的 一 部 分 ( 见 练 习 5.5.15、 练 习 5.5.16 和 练 
TY) 


“程序 5.5.1 SAT 求解 器 
public class SAT 
{ 


private boolean[] inSubset; 
private final String[] clauses; 
private final int n; 


public SAT(String[] clauses) 
{ 


this,clauses = clauses; 

n = clauses[0] .lengthO; 

inSubset = new boolean[n]; 

while (next(O)) 

if (check(clauses, inSubset)) return; 

} 
private boolean nextQO) -+ 
{ +-+ 

int 1 = + 二 。 

while ci Fe 


inSubset[i--] = false; 
if (i == -1) return false; 
} 
inSubset[i] = true; 
return true; 
大 
public static boolean check(...) 
/x 见 S00 页 +] 
public String toStringO 
帮 大 观 练 习 55.9 对 】 
public static void main(String[] args) 
{ 大 见 500 页 */ 和 
} 


这 个 程序 解决 任何 SAT 实 例 的 方式 是 : 通过 计数 来 检查 所 有 对 
。 En 开放 值 的 he 这 类 一 个 指数 级 时 间 算 法 。 





简单 来 说 ， 我 们 的 SAT 程序 可 以 简单 地 解决 这 个 问 。 % wore 5 
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% more tinySAT.txt 


% java SAT tinySAT.txt 
011 


AT30-by-30. txt 


题 的 很 多 大 型 实例 ， 如 右 图 所 示 。 请 注意 ，SAT 程序 会 在 
找到 解决 方案 后 立即 停止 。 在 这 种 情况 下 ,虽然 有 着 23= 
1 073 741 824 种 可 能 性 ， 这 个 程序 仅仅 测试 了 292 种 就 找 和 
到 了 解决 方案 。 这 个 实例 是 一 个 “随机 ”实例 ， 实 例 中 的 计生 
每 个 方程 平均 有 6 个 变量 ， 它 是 用 练习 ;5.5:13 给 出 的 程序 .+0 ;es 
生成 的 。 2 2 避 寺 忌 ， 加 导 
正如 我 们 提 到 的 那样 ，SAT 求解 器 已 经 被 广泛 地 用 于 
各 种 开业 应 用 中 7 在 这 些 应 用 中 我 们 豆 以 看 到 各 种 技术 天 年 辣 生 下 全 人 人 全 症 7 
用 以 让 程序 更 快 地 找到 解决 方案 。 例 如 ， 如 果 一 个 实例 有 二 .村 
两 个 方程 x+y= true 和 x'++y= true， 那 么 我 们 可 以 推断 任 和 
何 解 决 方案 都 必须 要 让 y= true; 除 此 之 外 ;在 所 有 其 他 方 下 
程 中 用 true 来 代 蔡 y 可 能 会 将 问题 进一步 的 简化 。 我 们 今生 
天 使 用 的 求解 器 是 几 十 年 来 这 种 发 展 的 结果 。 理 查 德 : 利 .ttesttot eeet 
普 顿 在 他 的 《P= NP 问题 和 哥 尔 德 委 失 的 信件 》 一 书 中 恰 站 于 
当地 总 结 了 这 种 情况 :“ 除 了 失败 的 情况 ，SAT 求解 器 都 可 
以 丰 区 解 开国 是 不 蕊 各 二 我 但 本 全 的 国 58 玉生 重头 基于 村 放 人 全 直下 三 基 2 
直 在 工作 直到 找到 一 个 问题 的 解 。 生地 公证 a > 
尽管 如 此 ， 对 于 一 些 熟 悉 的 输入 ， 所 有 的 SAT 求解 器 - % java SAT SAT30-by 30 txt 00 
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都 需要 指数 时 间 来 求解 。 例 如 ， 程 序 5.5.1 会 对 一 个 不 存在 解决 方案 的 实例 检查 所 有 的 2" 种 

可 能 的 分 配方 案 。 出 现在 真实 世界 的 应 用 程序 中 的 实例 是 否 更 适合 随机 模型 ， 而 非 最 坏 情况 

模型 呢 ? 没 有 人 知道 。 在 计算 理论 的 背景 下 ， 我 们 除了 将 SAT 求解 器 分 类 为 指数 时 间 的 算 
856| 法 外 别 无 选择 。 

这 种 情况 十 分 令 人 着 迷 ， 所 以 在 这 里 需要 强调 我 们 在 本 节 讨 论 的 理论 都 是 基于 最 坏 情况 
的 分 析 。 难 解 性 理论 的 主要 思想 为 我 们 对 计算 的 理解 做 出 了 很 大 的 贡献 ， 但 是 现实 世界 的 程 
序 员 已 经 找到 了 避免 最 坏 情 况 性 能 的 方法 。 

本 书 研究 的 所 有 应 用 领域 都 与 NP 完全 问题 存在 密切 联系 。 在 基础 编程 、 排 序 和 搜索 、 
图 形 处 理 、 字 符 串 处 理 、 科 学 计算 、 系 统 编程 以 及 任何 可 以 想象 到 涉及 计算 的 领域 都 存在 
NP 完全 问题 。 很 少 有 科学 理论 能 有 如 此 广泛 而 深远 的 影响 力 。 

对 于 上 一 节 描 述 的 可 计算 性 问题 来 说 ， 它 们 有 着 严谨 的 证 明 过 程 ， 因 此 很 少 有 人 会 去 怀 
疑 邱 奇 - 图 灵 假 设 ,， 而 且 我 们 也 确实 已 经 证 明 有 一 些 问 题 是 不 可 解 的 。 对 于 本 节 讨 论 的 难 解 
性 问题 ， 仍 然 有 两 个 地 方 让 我 们 无 法 完全 相信 它们 就 是 事实 。 首 先 ， 量 子 计算 已 经 引起 一 些 
人 怀疑 扩展 的 印 奇 - 图 灵 理 论 (但 是 仍然 没有 证 据 表 明 ， 如 果 我 们 能 够 从 物理 上 制造 一 台 量 
子 计 算 机 计算 设备 ， 我 们 就 可 以 在 多 项 式 时 间 内 解决 NP 完全 问题 )。 其 次 ， 没 有 人 能 证 明 
一 个 单一 的 搜索 问题 是 难以 解决 的 一 一 这 将 证 明 P 不 等 于 NP。 

即使 如 此 ，NP 完全 问题 的 存在 极 大 地 扩展 了 所 有 计算 机 都 存在 内 在 限制 的 观点 。 这 些 
问题 具有 重大 的 现实 意义 ， 但 是 鉴于 目前 的 知识 状况 ， 我 们 必须 认识 到 我 们 无 法 保证 能 有 效 

857| 地 解决 这 些 问题 。 
问答 环节 

问 : 多 项 式 时 间 算 法 总 是 有 效 的 吗 ? 

答 : 不 ,需要 使 用 mn 或 者 10"n? 步 的 算法 在 实际 应 用 中 和 指数 级 时 间 算 法 一 样 是 无 
用 的 。 但 是 实际 中 出 现 的 常量 通常 是 足够 小 的 ， 所 以 用 P 来 代表 “在 实践 中 有 用 的 算法 ”是 
合理 的 。 

问 : 指数 级 时 间 算 法 总 是 无 用 的 吗 ? 

答 : 不 。 例如 当 n 小 于 一 百 万 的 情况 下 ， 运 行 时 间 为 1.000 01” 的 算法 很 可 能 是 十 分 有 
用 的 。 同 样 的 ，SAT (程序 5.5.1 ) 对 于 许多 常规 输入 来 说 是 十 分 有 效 的 ， 其 中 包括 我 们 分 析 
过 的 随机 生成 的 输入 。 

问 : 为 什么 对 多 项 式 时 间 算 法 的 定义 〈 用 最 坏 运行 时 间 的 上 限定 义 ) 与 指数 级 时 间 算 法 
的 定义 (用 最 坏 运 行 时 间 的 下 限定 义 ) 有 所 不 同 ? 

答 : 通常 情况 下 ， 我 们 试图 将 “易于 解决 ”的 问题 和 “难以 解决 ”的 问题 相 区 别 。 对 于 
易于 解决 的 问题 ， 我 们 寻求 多 项 式 时 间 的 上 限 ， 而 对 于 难以 解决 的 问题 我 们 寻求 指数 时 间 的 
下 限 。 所 以 ， 当 我 们 提出 一 个 指数 级 时 间 算 法 时 ,我们 的 意思 是 (对 于 一 类 无 限 多 的 输入 ) 
它 运行 所 需要 的 时 间 最 少 是 指数 级 时 间 ， 而 非 最 多 。 

问 : 为 什么 一 个 指数 级 时 间 算 法 的 定义 要 求 算法 对 于 无 限 多 的 输入 需要 花费 指数 时 间 ， 
而 不 是 对 于 所 有 输入 。 

答 : 这 是 一 个 合理 的 替代 定义 (一些 计算 机 科学 家 使 用 更 严格 的 版 本 )。 我 们 没有 采用 
更 严格 的 版 本 ， 是 因为 我 们 认为 在 无 限 多 的 输入 的 情况 下 ， 任 何 需要 指数 时 间 的 算法 都 是 低 

[858] 效 的 。 
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问 : 是 否 存在 这 么 一 个 问题 ， 可 以 证 明 这 个 问题 的 最 好 算法 需要 指数 时 间 ， 但 是 这 个 问 
题 独立 于 P=NP? 问题 之 外 。 

答 : 是 的 。 确 实 存在 极 少数 的 自然 问题 需要 指数 时 间 。 以 下 版 本 的 停机 问题 是 一 个 值 
得 注意 的 例子 :给 定 一 个 没有 输入 的 图 灵机 (或 者 Java 程序 ) 和 整数 k， 这 个 图 灵机 (或 者 
这 个 Java 程序 ) 会 在 少 于 上 k 步 的 时 候 停止 吗 ? 你 只 需要 在 这 个 图 灵机 (或 者 这 个 Java 程序 ) 
上 运行 最 多 k 步 ， 直 到 它 停止 或 者 完成 t 步 。 研 究 人 员 已 经 证 明 没 有 比 穷 举 法 模拟 更 好 的 办 
法 。 这 种 穷 举 法 模拟 花 的 时 间 是 输入 大 小 的 指数 量 级 ;因为 输入 上 可 以 用 1lg 磊 位 进行 二 进 制 
编码 。 

问 : 有 一 些 问题 的 算法 既 不 是 多 项 式 时 间 函 数 也 不 是 指数 时 间 函 数 ， 如 n*”w”， 我 们 要 怎 
么 对 这 些 问 题 进 行 分 类 呢 ? 

答 : 好 问题 。 这 个 问题 的 一 个 著名 的 例子 是 图 同 构 ( graph isomorphism) 问题 ， 即 给 定 
两 个 图 ， 判 断 这 两 个 图 除了 顶点 的 名 称 以 外 是 否 等 价 。 这 个 问题 属于 NP 但 并 不 被 认为 (或 
被 相信 ) 是 NP 完全 的 。 科 学 家 在 2015 年 才 找 到 一 个 能 以 nn%" 时间 运行 的 算法 。 如 果 我 们 
在 某 天 能 找到 一 个 多 项 式 时 间 算法 来 解决 图 同 构 问题 ， 那 也 并 不 能 表示 P = NP。 

问 : 属于 NP 的 问题 中 有 既 不 属于 P 也 不 是 NP 完全 的 吗 ? 

答 : 是 的 。 在 P 关 NP 的 假设 下 ,， 理 查 德 … 拉 德 纳 (R. Ladner) 在 1975 年 证 明了 NP 中 
存在 既 不 属于 P 也 不 是 NP 完全 的 问题 。 一 些 研究 人 员 怀 疑 分 解 问 题 和 图 同 构 问 题 即 属于 此 
类 复杂 的 问题 。 

问 : 我 听 说 过 一 个 复杂 的 等 级 叫 “NP 难 ”(NP-hard) 问题 ， 那 是 什么 ? 

答 : 如 果 所 有 属于 NP 的 问题 都 能 归 约 成 某 个 问题 ， 那 么 这 个 问题 是 NP 难 的 。 这 个 定 
义 与 “NP 完全 ”是 相同 的 , 但 是 不 要 求 这 个 问题 属于 NP。 

问 : 为 什么 现代 密码 系统 不 是 基于 NP 完全 或 NP 难 问 题 而 是 因 式 分 解 ? 

答 : 研究 人 员 试 图 做 到 这 一 点 。 但 是 NP 完全 考虑 的 是 复杂 性 的 最 坏 情况 ， 而 密码 系统 
应 用 需要 在 实际 中 对 于 所 有 的 输入 都 是 难以 解决 的 。 

问 : 我 可 以 从 哪里 学 到 更 多 有 关 NP 完全 的 知识 ? 

答 : 有 一 本 经 典 的 参考 文献 是 Garey 和 Johnson 写 的 《计算 机 与 难 解 性 : NP 完全 性 理 
论 指南 》。 这 本 书 最 近 被 列 为 计算 机 科学 文献 中 被 引用 次 数 最 多 的 参考 文献 。 许 多 重要 的 后 
续 发 现 都 被 记载 在 《算法 杂志 》( Journal of Algorithms) 中 的 Johnson 的 NP-completeness 栏 
目 里 。 


练习 
5.5.1 “填写 下 表 中 的 空格 (对 于 较 大 的 数字 以 10 为 底数 )。 





5.5.2 ”编写 一 个 可 以 实现 高 斯 消 元 法 的 Java 程序 。 用 户 需 要 输入 n 行 信息 (每 行 对 应 一 个 方程 )， 每 行 
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都 有 n+ 1 个 双 精 度 值 (变量 的 系数 和 等 式 右 侧 的 值 )。 首 先 假设 方程 组 存在 唯一 的 解 ， 并 根据 
文中 给 出 的 例子 调试 程序 。 然 后 讨论 可 能 出 现 的 问题 和 应 对 的 策略 。 

如 果 有 一 些 算法 对 于 无 限 输入 花费 的 时 间 与 1.5" 成 比例 ， 那 么 将 这 些 算法 描述 为 指数 级 时 间 算 
法 是 否 合适 ? 解释 你 的 答案 。 并 将 花费 的 时 间 替 换 为 n!、n*，2Vn 和 nw"*"， 再 次 回答 问题 。 
编写 一 个 程序 ， 这 个 程序 可 以 从 标准 输入 中 读 取 个 整数 的 序列 ， 并 找到 总 和 为 0 的 非 空子 集 
(或 者 报告 不 存在 这 样 的 子 集 )。 你 需要 穷 举 n 个 整数 的 所 有 2" 个 子 集 。 

为 下 图 找到 一 个 最 少 元 素 的 顶点 覆盖 解决 方案 : 





当 : (1) m 是 常数 ; (2 ) m 大 约 为 n/2 时 ， 对 于 一 个 具有 nn 个 顶点 的 图 ， 估 上 略 计算 至 多 有 m 
个 顶点 的 子 集 数量 。 

编写 一 个 方法 ， 这 个 方法 以 图 G 和 一 个 顶点 的 子 集 为 输入 ， 并 确定 这 个 顶点 的 子 集 是 否 为 一 个 
顶点 覆盖 。 

证 明 任 何 布尔 可 满足 性 问题 都 可 以 转化 为 一 种 形式 ， 这 种 形式 的 左 侧 不 使 用 与 操作 符 且 右 侧 都 
为 真 。 提 示 : 参见 7.1 节 中 布尔 函数 中 关于 求 和 的 定义 。 

为 SAT 实现 一 个 toString() 方法 (程序 5.5.1 )。 


5.5.10 ”为 SAT 问题 开发 一 个 使 用 二 维 整数 数组 表示 的 方法 。 将 正文 中 的 数组 string 中 的 +1、-1 和 0， 
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用 “+”"、“-” 和 “.” 来 替换 。 通 过 为 你 的 表示 开发 一 个 多 项 式 时 间 的 check() 方法 来 证 明 
SAT 属于 NP。 

证 明 0/1 ILP 属于 NP。 

考虑 以 下 经 典 问题 : 

旅行 商 问 题 (Traveling salesperson，TSP) : 给 定 一 组 nn 个 城市 的 集合 和 一 个 距离 m， 找 
到 一 个 长 度 小 于 或 等 于 m 的 遍历 所 有 城市 的 旅行 方法 ; 或 者 报告 不 存在 这 种 旅行 方法 。 

为 了 避免 比较 整数 平方 根 之 和 的 技术 问题 ， 我 们 假定 所 有 距离 都 是 整数 (采用 欧 几 里 得 
距离 表示 ， 单 位 为 英里 或 米 ， 取 相近 的 整数 )。 通 过 开发 一 个 多 项 式 时 间 的 check() 方法 来 证 
明 TSP 属于 NP， 这 个 方法 可 以 检查 一 个 给 定 旅 行 方法 是 否 能 够 满足 给 定 距 离 的 限制 。 假 设 
check() 的 参数 是 一 个 整数 n( 城 市 的 数量 )、 一 个 整数 m (描述 旅行 方法 的 长 度 上 限 )、 两 个 整 
数 数组 x[] 和 y[] (点 的 x、y 轴 坐 标 )， 以 及 一 个 整数 数组 tour[] 用 于 指定 城市 出 现在 旅行 方法 
中 的 顺序 。 
编写 一 个 名 为 GenerateSAT 的 程序 ， 这 个 程序 可 以 生成 随机 的 SAT 实例 ， 格 式 如 文中 所 述 。 
程序 需要 以 下 四 个 命令 行 参数 : 

。m， 方程 的 数量 

。n， 变 量 的 数量 

。 p， 非 负 变 量 的 百分比 
。 94 负 变量 的 百分比 
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答案 : 
public class GenerateSAT 


public static void main(String[] args) 
int m = Integer.parseInt(args[1]); 
int n = Integer.parseInt(args[0]); 
double p = Double.parseDouble(args[2]); 
double q = Double.parseDouble(args[3]); 
for Cint k = 0; k < mi k++) 
: String equation = "" 
for (intSi ="0; 1 < n; “iy+) 
| double x = StdRandom.uniform() ; 
if (x < p) equation += "+"; 
else if (x < p+q) equation += "-"; 
else equation += "."; 
PR ee 
和 
} 
正文 中 使 用 的 SAT30-by-30.txt 文件 就 是 由 该 程序 创建 的 一 一 使 用 命令 “ java GenerateSAT 30 
30 0.1 0.1” 创 建 。 
以 各 种 各 样 的 参数 运行 练习 5.5.13 中 的 GenerateSAT 程序 试图 找到 一 个 SAT 实例 ， 这 个 
SAT 实例 有 30 个 变量 ， 这 些 变量 可 以 使 得 SAT 程序 中 执行 测试 的 次 数 尽 可 能 增多 。 
在 6.1 节 中 ,我 们 描述 了 Java 对 int 类 型 值 的 二 进 制 表示 的 操作 ， 并 引入 了 如 下 代码 : 
。“1 <<n” 可 以 计算 2"。 
。“(v >> 让 &1” 是 v 的 二 进 制 表 示 从 右 侧 数 起 的 第 i 位 。 
基于 这 些 代码 片段 实现 一 个 SAT。 
基于 一 个 像 TowersOfHanoi (程序 2.3.2 ) 的 递归 函数 实现 一 个 SAT : 将 inSubset[] 中 最 右边 
的 值 设 置 为 false， 然后 调用 递归 函数 来 生成 所 有 剩余 可 能 的 值 ， 然 后 将 最 右边 的 值 设置 为 
true 并 进行 递归 调用 ， 以 便 可 以 再 次 生成 所 有 剩余 可 能 的 值 。 对 于 得 到 的 每 一 种 情况 再 调用 
check()。 
基于 一 个 像 Beckett (程序 2.3.3 ) 的 递归 函数 实现 一 个 SAT。 对 于 某 些 应 用 ， 这 种 方法 比 练习 
5.5.16 中 的 方法 更 受 欢迎 ， 因 为 子 集 的 大 小 每 次 最 多 只 会 改变 1。 
使 用 SAT 中 的 代码 和 前 文 5.5 节 中 给 出 的 check0 方法 作为 基础 ， 开 发 一 个 SubsetSum 程序 ， 
这 个 程序 可 以 为 任何 给 定 的 数字 集合 生成 子 集 并 寻找 问题 的 解 。 
使 用 SAT 中 的 代码 和 练习 5.5.7 中 的 check() 方法 作为 基础 ， 开 发 一 个 VertexCover 程序 ， 这 
个 程序 可 以 为 任何 给 定 的 图 找到 顶点 覆盖 问题 的 解 (上 限 为 覆盖 的 顶点 数 )。 
将 SAT 中 子 集 生成 部 分 的 代码 封装 到 自己 的 类 中 ， 然 后 基于 这 个 类 实现 SAT (程序 5.5.1 )、 
SubsetSum (练习 5.5.18 ) 和 VertexCover (练习 5.5.19 ) 。 
描述 一 些 需 要 SAT 计算 n 个 变量 的 所 有 2" 种 情况 的 实例 。 
答案 : 使 用 个 方程 ， 其 中 第 i 个 方程 中 仅 包 含 第 i 个 变量 ( 非 负 )。 只 有 当 所 有 的 变量 都 为 
true 时 ， 这 些 方 程 才能 同时 被 满足 ， 这 是 最 后 一 个 被 SAT 检测 的 条 件 。 


假设 有 两 个 问题 已 知 是 NP 完全 的 。 这 是 否 意味 着 这 两 个 问题 中 的 一 个 可 以 通过 多 项 式 时 间 归 
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约 为 另 一 个 。 

假设 并 是 NP 完全 的 , 对 可 以 归 约 成 Y， 了 也 可 以 归 约 成 了 必然 是 NP 完全 的 吗 ? 

答案 : 不 , 了 可 以 不 属于 NP。 

如 果 P 取 NP， 那么 是 否 有 一 个 算法 能 在 nlogn 的 时 间 范 围 内 解决 NP 完全 问题 ? 解释 你 的 
答案 。 

假设 有 人 发 现 了 一 个 保证 能 在 正比 于 1.1” 的 时 间 内 解决 布尔 可 满足 性 问题 的 算法 。 这 是 否 意 
味 着 我 们 可 以 在 正比 于 1.17 的 时 间 内 解决 其 他 NP 完全 问题 。 

一 个 能 在 正比 于 1.1 的 时 间 内 解决 顶点 覆盖 问题 的 程序 有 什么 重大 意义 ? 

我 们 假设 P 了 去 NP， 那么 下 面 选 项 中 的 哪 一 个 可 以 从 TSP 是 NP 完全 的 事实 中 推断 出 来 ? 

a. 不 存在 能 解决 任意 TSP 实例 的 算法 。 

b. 不 存在 能 有 效 解决 任意 TSP 实例 的 算法 

c. 存在 一 种 能 有 效 解决 任意 TSP 实例 的 算法 ,但 是 没有 人 能 找到 它 。 

d. TSP 不 属于 P。 

e. 对 于 某 些 输入 ， 所 有 算法 都 能 保证 在 多 项 式 时 间 内 解决 TSP。 

f. 对 于 所 有 输入 ， 所 有 算法 都 能 保证 在 指数 级 时 间 内 解决 TSP。 

答案 : 只 有 b 和 d。 

我 们 假设 P 关 NP， 且 : 因 式 分 解 属于 NP， 但 我 们 并 不 知道 它 是 P 还 是 NP 完全 的 ， 那么 ,可 
以 推断 出 以 下 哪个 观点 ? 

a. 存在 一 个 可 以 解决 因 式 分 解 任意 实例 的 算法 。 

b. 存在 一 种 算法 可 以 有 效 地 解决 因 式 分 解 的 任意 实例 ， 但 是 没 人 能 找到 它 。 

c. 如 果 我 们 找到 一 个 有 效 的 因 式 分 解 算法 ,我 们 可 以 用 它 来 解决 TSP 问题 。 

解释 为 什么 以 下 问题 都 不 是 NP 完全 的 。 

a. TSP 的 穷 举 法 。 

b. 归并 排序 。 

c. 停 机 问题 。 

d. 希 尔 伯 特 的 第 十 个 问题 。 

答案 : NP 完全 描述 的 是 问题 而 不 是 问题 的 具体 算法 ， 所 以 将 选项 a 和 描述 为 NP 完全 是 不 
正确 的 (苹果 和 桔子 也 不 是 NP 完全 的 )。 停 机 问题 和 希 尔 伯 特 的 第 十 个 问题 是 不 可 判定 的 ， 
所 以 它们 不 属于 NP， 因 此 也 不 是 NP 完全 的 。 

证 明 多 项 式 时 间 的 归 约 是 可 以 传递 的 。 即 证 明 如 果 A 可 以 在 多 项 式 时 间 内 归 约 成 B，B 可 以 
在 多 项 式 时 间 内 归 约 成 C， 则 A 可 以 在 多 项 式 时 间 内 归 约 成 C。 

A 和 B 是 两 个 决策 问题 。 假 设 我 们 知道 A 可 以 在 多 项 式 时 间 内 归 约 成 B。 我 们 可 以 推导 出 以 
下 结论 的 哪 一 个 ? 

a. 如 果 B 是 NP 完全 的 ， 那 么 A 也 是 。 

b. 如 果 A 是 NP 完全 的 ， 那么 B 也 是 。 

c. 如 果 B 是 NP 完全 的 且 A 属于 NP, 那么 A 是 NP 完全 的 。 

d. 如 果 A 是 NP 完全 的 且 B 属于 NP， 那么 B 是 NP 完全 的 。 

e.A 和 B 不 能 同时 是 NP 完全 的 。 

f. 如 果 A 属于 P， 那么 B 属 于 P。 

g. 如 果 B 属于 P, 那么 A 属于 P。 


5.%32 


5.5.33 


5.5.34 


全 


5.5.36 


S58:37 


5.5.38 


39 


答案 : 只 有 d 和 g。 
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证 明 在 有 向 图 中 找到 哈密 顿 回 路 的 问题 是 NP 完全 的 。 可 以 通过 对 在 无 向 图 找到 哈密 顿 回路 的 


算法 进行 归 约 来 解决 。 


假设 我 们 有 一 个 算法 可 以 解决 布尔 可 满足 性 问题 的 决策 版 本 一 一 对 于 任意 输入 来 说 ， 它 可 以 
确定 是 否 存 在 一 个 变量 的 真 值 分 配 来 满足 布尔 表达 式 。 演 示 如 何 用 这 种 算法 来 找到 一 个 分 配 


方案 。 


假设 我 们 有 一 个 解决 顶点 履 盖 问题 的 算法 一 一 对 于 任意 的 图 和 任意 的 整数 m， 它 可 以 判定 是 否 
存在 最 多 只 有 m 个 顶点 的 顶点 覆盖 或 者 报告 不 存在 。 展 示 如 何 使 用 这 样 一 个 算法 来 解决 问题 
的 优化 版 本 一 一 给 定 任意 的 图 ， 找 到 一 个 顶点 个 数 最 少 的 顶点 覆盖 方案 。 


解释 为 什么 顶点 覆盖 问题 的 优化 版 本 不 是 一 个 搜索 问题 。 


答案 : 没有 办 法 来 验证 一 个 新 提出 的 解决 方案 是 最 好 的 。 顶 点 覆盖 的 决策 版 本 是 一 个 搜索 问 
题 ( 当 距 离 都 是 整数 时 )， 因 为 我 们 可 以 使 用 二 分 搜索 来 找到 最 佳 的 解决 方案 。 867 


创新 练习 


因 式 分 解 。 通 过 修改 Factors (程序 1.3.9 ) 来 使 用 BigInteger， 并 
使 用 它 来 因 式 分 解 1111111111, 11111111111, …, (10"-1)/9, …， 尽 
可 能 优化 你 的 程序 ， 看 它 能 不 能 在 10 秒 的 运行 时 间 内 完成 因 式 
分 解 。 
因 式 分 解决 策 问题 。 下 面 显示 了 如 何 将 因 式 分 解 的 决策 版 本 转化 为 
一 个 搜索 问题 。 具 体 来 说 ， 给 定 一 个 静态 的 方法 factor(xy)， 如 果 x 
有 小 于 y 的 非 平 凡 因 子 ， 这 个 方法 返回 true， 编 写 一 个 静态 的 方法 
factor() 来 打印 出 x 的 因子 。 
SAT 检查 器 图 灵机 。 开 发 一 个 TM， 这 个 TM 可 以 检查 一 组 给 定 的 值 
是 否 满足 一 个 给 定 的 SAT 实例 。 假 设 有 三 个 变量 ,字母 表 为 “#01x 
yzZx'y'z ()#”， 而且 纸 带 的 初始 内 容 是 要 检查 的 x、y、z 的 值 ， 后面 
跟 SAT 实例 的 简短 表示 形式 。 例 如 ， 文 中 给 出 的 例子 中 的 纸 带 里 含有 : 
# Ol x Ny CX Hy Y(t ye 
答案 : 见 右 侧 画 出 的 TM。 对 于 每 一 个 变量 , 它 将 读 取 一 个 值 ， 在 向 
右 的 扫描 中 对 表达 式 中 的 每 一 个 变量 进行 值 的 替换 ， 然 后 在 向 左 的 
扫描 中 将 表达 式 中 每 一 个 带 有 和 否定 符号 的 变量 的 值 进行 替换 。 在 完 
成 所 有 蔡 换 之 后 ，TM 底部 的 五 个 状态 会 扫描 整个 表达 式 来 寻找 是 否 
有 某 一 对 括号 中 所 有 变量 的 值 都 不 为 1。 如 果 找 到 了 这 样 一 个 集合 ， 
它 进入 一 个 Yes 状态 。 如 果 没 有 找到 ， 则 它 进入 一 个 No 状态 。 这 个 
解决 方案 很 容易 扩展 到 个 变量 , 但 并 不 能 证 明 SAT 属于 NP。 要 
想 完 成 证 明 ， 需 要 一 个 与 无关 的 更 复杂 的 图 灵机 结构 。 
SAT 检查 器 模拟 。 制 作 一 个 文本 文件 ， 这 个 文件 可 以 为 练习 5.5.38 
中 的 通用 DFA TM 提供 一 个 表格 表示 法 。 从 本 书 网 站 上 下 载 
TuringMachine.java 和 Tape.java， 按 照 练习 5.2.7 和 练习 5.2.8 中 所 
述 进 行 修改 ， 然 后 生成 这 个 机 器 对 于 指定 输入 的 运行 轨迹 。 


5.5.40 


5.5.41 


5.5.42 


5.5.43 


5.5.44 


务 了 六 


答案 : 

鸭 0 1Cx zy)Cx+Fy'+z)TCX4y) (x+y')# 从 左边 开始 
##IICx+Ez) (Oo+y+z)(o+y) (x'+y' 有 | 将 x 替换 为 0 

垃 #j1 1Cl+z)CO+ty+z) (C0+y) (1l+y')# 将 + 坷 换 为 1 
###1C1+zZ)(0+y'+z)(0+1)(1+y')[ 列 将 替换 为 1 
##Bh Ci+z)Cc0+0+z)(C0+1)(1i+0)# 将 ? 圣 换 为 0 

## 冰 #(1+I) (0+0+1)(Co+f1)(1+0) 国 将 :替换 为 1 

#### 国 1+17 (Co0+0+1) (04+1) 0140)# 将 z 营 换 为 0 
####[+IDICoro+dayCorda7CLEH0D9# 次 找 “(" 或 者 “ 扩 
#### (1)CO+0+#1)(0+E) (1+0)# 查找 在 “)” 之 前 的 1 
## 关 者 (1+1I)[hbaror92 (0+1) (1+0.)# .查找 “(” 或 者 “#" 
####(1+1)(0+0+Ep (0+1) (1+0)# 查找 在 “)” 之 前 的 
## 字 # 才 (TI+I7 (0+034 工 [piI7) CI30 了 # 查找 “或 者 “机 
### 冰 #(T+I) (0O+0+Ii)(Co+ED(C1+07# 查找 在 ”之 前 的 1 
亲 关 好 # (1+1) (0+0+1)(o+l)[Ch+o)# 查找 “(” 或 者 “#” 
# 状 # 夫 (1I+1I) (0+0+1)(0+1) (加 fo)# 查找 在 “)” 之 前 的 
#####(C(1+1)(0+0+1)(0+1) (1+0)[ 下 查找“(” 或 者 “入 
负 章 庆 间 CT1tLLJ) (0+0+1)(0+1) C140)# 接 感 


子 集 求 和 (动态 规划 解决 方案 )。 开 发 一 个 名 为 SubsetSumDP 的 Java 程序 ， 这 个 程序 可 以 从 
标准 输入 读 取 整数 ， 然 后 尝试 所 有 的 可 能 性 来 找到 一 个 数字 之 和 为 0 问题, 

的 子 集 。 使 用 下 列 方法 : 使 用 一 个 三 维 布尔 数组 subset[] 上 ]， 若 指定 :人 3 人吉 让 
如 果 前 7 个 数 的 和 为 记 则 subset[ 引 四 为 true， 你 的 程序 的 运行 时 间 

为 多 长 ? 解释 你 的 程序 为 什么 不 能 证 明 P =-NP。 

顶点 覆盖 问题 的 近似 算法 。 考 虑 顶点 覆盖 的 以 下 算法 : 移 除 一 条 边 ， 
并 将 这 条 边 的 终点 加 入 覆盖 的 集合 中 ， 然 后 移 除 在 这 个 终点 上 的 所 有 
边 ， 不 断 迭 代 直 到 没有 剩 下 的 边 。 证 明 这 样 产 生 的 顶点 覆盖 的 结果 规 
模 不 可 能 超过 最 优 解 的 2 倍 。 

佩 尔 方程 。 编 写 一 个 BigInteger 的 客户 程序 Pell， 这 个 客户 程序 可 以 
读 取 一 个 整数 c， 并且 可 以 找到 佩 尔 方程 : x*-cy” = 1 的 最 小 解 。 对 于 
c= 61， 最 小 的 解 为 (1, 766, 319, 049, 226, 153, 980 ) 。 对 于 c = 313， 
最 小 的 解 为 (3, 218, 812, 082, 913, 484, 91, 819, 380, 158, 564, 160)。 
这 个 问题 已 经 证 明 无 法 在 多 项 式 (作为 输入 c 的 位 数 的 函数 ) 步 数 内 
求解 ， 因 为 输出 可 能 需要 指数 级 位 数 ! 

欧 几 里 得 TSP。 开 发 一 个 Java 程序 TSP， 这 个 程序 可 以 通过 尝试 所 有 
的 可 能 性 来 找到 一 个 最 小 长 度 的 TSP 旅行 方法 ( 见 练习 5.5.12)。 使 用 
一 个 递归 程序 来 维护 一 个 标志 当前 路 径 上 所 有 城市 的 数组 ， 并 尝试 所 
有 可 能 的 下 一 个 城市 。 注 意 : 对 于 很 大 的 ”你 的 程序 将 不 会 结束 ， 因 
为 有 (n-1)!/2 种 不 同 的 可 能 性 可 以 尝试 ， 而且 nl! 要 远 远 大 于 2”( 见 练习 
5.5.1 )。 对 于 很 大 的 石 没有 人 知道 能 够 保证 解决 这 个 问题 的 算法 。 

带 回溯 的 欧 几 里 得 TSP。 修 改 你 在 练习 5.5.43 中 的 程序 ; 使 得 程序 会 
停止 搜索 任何 比 当前 已 知 最 小 旅行 路 径 更 长 的 路 径 。 在 小 于 100 万 的 
坐标 系 中 随机 取 正 整数 值 作为 不 同 的 nx， 求 两 种 情况 下 可 能 性 的 概率 * 
并 作 图 表 展 示 你 的 数据 。 一 个 欧 几 里 得 TSP 实例 
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Compnuter Science: An Interdisciplinary Approach 


构建 一 台 计 算 机 





本 章 的 目标 是 向 你 展示 我 们 日 常 使 用 的 计算 机 的 原理 是 多 么 简单 。 本 章 将 假想 一 个 简单 
的 计算 机 ， 并 详细 描述 它 的 构造 过 程 。 需 要 说 明 的 是 ,许多 在 我 们 日 常 使 用 的 计算 设备 的 核 
心 处 理 器 所 具有 的 特点 ， 这 个 假想 的 计算 机 也 具有 。 

你 可 能 会 很 惊奇 地 发 现 ， 许 多 机 器 拥有 相同 的 属性 ， 即 使 是 开发 出 的 第 一 台 计 算 机 也 如 
此 。 因 此 ， 我们 选择 从 历史 的 角度 来 讲解 这 一 点 。 想 象 在 一 个 没有 计算 机 的 世界 ， 你 会 倍加 
渴望 哪些 设备 ， 你 的 结论 必然 是 与 我 们 现在 所 拥有 的 计算 机 没什么 差别 ! 我 们 将 从 科学 计算 
的 角度 讲述 这 个 传奇 的 过 程 ， 甚 实 从 商业 计算 的 观点 来 看 ， 这 点 同样 具有 吸引 力 。 

接 下 来 ,我们 的 目标 是 向 你 阐述 : 在 一 台 简 单机 器 上 如 何 使 用 它 自 己 的 机 器 语言 
(machine language) 实现 Java 编程 中 涉及 的 基本 概念 和 结构 。 这 个 任务 并 不 困难 。 我们 还 将 
详细 介绍 条 件 、 循 环 、 函 数 、 数 组 以 及 链接 结构 。 由 于 在 Java 中 有 相同 的 基本 工具 ， 因 此 ， 
接 下 来 会 介绍 几 个 在 本 书 第 一 部 分 讨论 过 的 计算 任务 ， 这 些 任务 在 较 低 的 层面 上 也 不 难 解 决 。 

这 个 简单 的 假想 计算 机 介 于 计算 机 与 实际 硬件 电路 之 间 。 实 际 上 硬件 电路 是 通过 改变 状 
态 以 反映 程序 的 动作 。 我 们 在 下 一 章 中 会 学 习 这 些 电路 的 工作 原理 。 

当然 了 ， 这 只 是 整个 计算 机 的 复杂 工作 原理 中 的 一 部 分 。 最 后 ， 我 们 会 以 一 个 深刻 的 思考 
结束 本 章 : 我 们 可 以 使 用 一 台 机 器 来 模拟 另 一 台 机 器 的 操作 。 因 此 ， 我 们 可 以 轻松 研究 假想 计 
算 机 ， 我 们 也 可 以 开发 未 来 将 要 建成 的 新 机 器 ， 甚 至 可 以 研究 那些 可 能 永远 不 会 构建 的 机 器 。 


6.1 信息 表示 


理解 计算 机 工作 原理 的 第 一 步 是 理解 计算 机 内 的 信息 表示 方式 。 正 如 从 Java 编程 中 所 
了 解 到 的 ,无 论 是 数字 、 文 本 、 可 执行 文件 、 图 像 、 音 频 还 是 视频 ;凡是 可 以 表示 成 0 和 1 
序列 的 所 有 形式 的 信息 ， 都 可 以 用 数字 计算 机 进行 处 理 。 对 于 每 种 类 型 的 数据 ， 标 准 编码 方 
法 已 得 到 广泛 应 用 : ASCII 标准 将 128 个 不 同 字符 与 7 位 二 进 制 数 相关 联 ，MP3 文件 格式 严 
格 地 规定 了 将 每 个 原始 音频 文件 编码 为 0/1 序列 的 方式 ，.png 图 片 格式 指定 了 将 数字 图 像 中 
的 像素 最 终 表 示 为 0/1 序列 的 方法 ， 等 等 。 

在 计算 机 中 ,信息 通常 组 织 为 字 ( word) 的 形式 ， 字 是 一 个 固定 长 度 〈 称 为 字 长 ) 的 位 序 
列 。 后 续 你 将 了 解 到 ， 字 长 在 任何 一 台 计 算 机 的 架构 中 都 起 着 关键 的 作用 。 在 早期 的 计算 机 
中 ， 典 型 的 字 长 是 12 位 或 16 位 ; 32 位 的 字 长 又 被 广泛 使 用 多 年 ; 而 现在 ,64 位 字 长 成 为 常态 。 

每 台 计 算 机 中 的 信息 内 容 是 一 个 字 的 序列 ， 每 个 字 都 是 由 固定 数量 的 位 (bit) 组 成 ， 每 
位 都 是 0 或 者 1。 由 于 我 们 可 以 将 每 个 字 解 释 为 二 进 制 表示 的 数字 ， 所 以 所 有 信息 都 是 数 
字 ， 所 有 数字 也 都 是 信息 。 

计算 机 内 一 个 给 定 的 位 序列 的 含义 取决 于 上 下 文 。 这 是 我 们 将 在 本 章 通 篇 都 会 重复 的 另 
一 名 话 。 例 如 ， 如 你 所 见 ， 根 据 上 下 文 ,我 们 可 能 会 将 二 进 制 字符 串 1111101011001110 解 
释 为 正 整数 64 206、 负 整数 -1330、 实 数 -55 744.0 或 两 个 字符 的 字符 串 “eN ”。 

二 进 制 数字 系统 对 计算 机 而 言 可 能 很 方便 ， 但 对 人 类 而 言 极 其 不 便 。 如 果 你 对 这 一 事 
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实 表示 难以 接受 ， 你 可 以 尝试 记 住 16 位 二 进 制 数 1111101011001110， 然 后 合 上 本 书 并 将 其 
默写 下 来 。 为 了 适应 计算 机 以 三 进 制 进行 通信 的 需求 ， 同 时 适应 我 们 使 用 更 紧凑 的 表示 的 需 
要 ; 我 们 将 在 本 节 介 绍 十 六 进 制 (基数 为 16 ) 数字 系统 ， 它 可 以 很 方便 地 将 二 进 制 数字 进行 
缩写 。 因 此 ， 我 们 从 详细 介绍 十 六 进 制 开始 。 

二 进 制 和 十 六 进 制 ”现在 ， 考 虑 非 负 整数 或 者 自然 数 (natural number)， 这 是 计数 的 基 
本 数学 抽象 概念 。 自 从 巴比伦 时 代 以 来 ， 人 们 已 经 用 按 位 计数 法 ( positional notation) 和 一 
个 固定 的 基数 ( base) 来 表示 整数 。 这 些 系统 中 最 熟悉 的 是 十 进 制 ， 其 基数 为 10， 每 个 正 整 
数 表示 为 0 到 9 之 间 的 数字 串 。 具体 来 说 ， dndn-1"*…d2d1ido 表示 整数 : 

ds10" + d,110™ + FAd210: + di10! + do10° 
例如 ，10 345 表示 整数 
10 345=1 * 10 000+0* 1000+3°. 100+4: 10+5 “1 

用 任何 一 个 比 1 大 的 整数 替换 基数 10， 就 可 以 得 到 一 个 不 同 的 数字 系统 ， 用 一 串 数 字 
可 以 表示 任何 整数 ， 其 中 数 串 中 的 每 一 位 数字 均 在 0 到 比 基 数 小 1 的 数字 之 间 。 在 本 章 中 ， 
我 们 特别 感 兴趣 的 是 二 进 制 (基数 为 2) 和 十 六 进 制 (基数 为 16 )。 

二 进 制 。 当 基数 为 2 时， 可 以 用 一 个 0/1 序列 表示 一 个 整数 。 在 这 种 情况 下 ， 将 每 个 二 
进 制 (基数 为 2) 数字 一 一 0 或 1 一 一 作为 一 位 ， 这 也 是 计算 机 中 信息 表示 的 基础 。 在 这 种 情 
况 下 ， 这 些 位 都 是 以 这 为 底 的 寡 的 系数 。 具体 地 ， 位 序列 bnbn-1 ** bsbibo 表示 整数 : 

b,2" + bi2" +. + by 2 +bi2!+ bo2° 

例如 ，1100011 表示 整数 

99=1.64+1.32+0.16+0.8+0:4+1.2+1.1 

用 这 个 系统 所 能 表示 的 nn 位 数字 的 最 大 整数 为 2 -1， 此 时 位 均 为 1。 例如 8 位 时 ， 
11111111 表示 : 

25-1=255=1°:128+1°.64+1.32+1°:16+1°:8+1.:4+1.:2+1.:1 

表述 这 个 限制 的 男 一 种 说 法 是 ,，n 位 二 进 制 数 只 能 表示 2 个 非 负 整 数 (0 一 2 一 1 )。 在 
使 用 计算 机 处 理 整数 时 ,通常 需要 注意 这 些 限制 a 另外 ， 使 用 二 FE 渤 制 二进制 下 关 进 抽 
进 制 符号 的 一 个 大 的 缺点 是 用 二 进 制 表示 一 个 数字 所 需 的 位 数 比 6 0000 








0 

用 十 进 制 表示 相同 数字 所 需 的 位 数 要 大 得 多 。 仅 仅 使 用 二 进 制 与 1 0001 1 
计算 机 进行 通信 会 非常 笨拙 上 且 不 切实 际 。 2 0010 2 
十 六 进 制 。 在 十 六 进 制 中 ， 十 六 进 制 数字 序列 hahn1 *… hshiho 3 0011 3 
表示 数字 : 4 0100 4 
hl16" + hs 116"! + .+ hz16 + hil6! + hol16° 3 0101 5 

我 们 遇 到 的 第 一 个 复杂 的 问题 是 ， 由 于 基数 是 16， 就 需要 f 9 1PEyEe 
0 一 15 之 间 的 每 一 个 数字 。 每 个 数字 都 需要 用 一 个 字符 来 表示 ， 所 人 县 寺 划 抽 且 册 
以 使 用 A 来 表示 10、B 表示 11.C 表示 12 等 ， 如 右 表 所 示 。 例 如 2 10 
六 9 1001 9 

FACE 表示 整数 : 10 1010 -A 
64206=15*16+10.16+12:16'+14:16" 晤 了 出 各 注 放 10 

该 数字 与 前 文 的 16 位 二 进 制 表示 的 数字 相同 。 从 这 个 例子 中 可 以 诉 东 本 其 
看 出 ， 以 十 六 进 制 表示 整数 所 需 的 十 六 进 制 数字 的 数量 比 用 二 进 13 1101 D 
制 表 示 相 同 整数 所 需 位 数 要 小 得 多 ( 约 四 分 之 一 )。 此 外 ， 数 字 的 ID 部 书 E 
多 样 性 使 得 一 个 数 更 容易 记忆 。 遇 到 1111101011001110 你 可 能 会 15 iit -一 F 


迷茫 ， 但 你 可 以 很 容易 就 记 住 FACE。 0 一 15 之 间 所 有 整数 的 表示 
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十 六 进 制 和 二 进 制 之 间 的 转换 。 给 定 一 个 数字 的 十 六 进 制 表示 ， 很 容易 就 可 找 出 其 二 

| 六 进 制 转换 为 二 进 制 ”1CAB 进 制 表示 ， 反 之 亦 然 ， 如 左 图 所 示 。 由 于 十 六 进 制 的 

基数 16 是 二 进 制 基数 2 的 4 次 需 ， 可 以 以 4 位 为 一 

0001110010101011 组 ， 转 换 为 十 六 进 制 ， 反 之 亦 然 。 为 了 从 十 六 进 制 转 

二 进 制 转换 为 十 六 进 制 换 为 二 进 制 ， 可 以 用 4 个 二 进 制 位 代替 一 个 数值 相等 

1110011100010000 ”的 十 六 进 制 数 。 相 反 ， 给 定 一 个 二 进 制 数 ， 在 前 面 补 0 

NY 使 其 位 数 为 4 的 倍数 ， 然 后 每 4 位 为 一 组 ， 将 每 组 转 

3 中 换 为 一 个 十 六 进 制 数 。 你 可 以 通过 数学 证 明 这 些 转换 

“二 外 5 一 这 币 轩 的 直 人 的 正确 性 ( 见 练习 -6.108 )， 但 其 实 只 需 用 几 个 例子 就 可 

以 说 服 你 。 例 如 ， 整 数 39 的 十 六 进 制 表示 为 27， 所 以 其 三 进 制 表 示 为 00100111 (前 面 的 

0 可 以 省 略 ); 228 的 二 进 制 表示 为 11100100， 所 以 其 十 六 进 制 表示 为 E4。 作 为 一 种 与 计算 

机 进行 通信 和 的 有 效 方式 ， 二 进 制 与 十 六 进 制 之 间 的 这 种 快速 转换 能 力 非常 重要 。 一 旦 你 对 
A 对 应 1010、5 对 应 0101、F 对 应 1111 等 熟 记 于 心 ， 你 就 会 很 快 掌握 这 门 技能 。 

从 十 进 制 到 二 进 制 的 转换 。 在 前 面 的 编程 示例 中 ， 我 们 已 经 学 习 了 如 何 将 给 定 十 进 制 整 

数 转 换 成 对 应 的 二 进 制 0/1 序列 的 字符 串 。 下 面 的 递归 程序 (练习 2.3.15 的 解决 方案 ) 完成 

了 这 项 工作 ， 值 得 仔细 研究 : 


public static String toBinaryString(int n) 





if (Cn == 0) return "" 
if,(n;% 2 ==0) 
return toBinaryString(n/2) + '0'; 
else 
return toBinaryString(n/2) + '1'; 
3 


这 是 一 种 递归 的 方法 ， 基 于 如 下 想法 : 数字 的 最 后 一 个 二 进 制 字符 可 以 表示 为 n%%2 (如 
果 n%2 为 0， 则 数字 为 “0”; 如 果 n%2 为 1， 则 


数字 为 “1' )， 字 符 囊 的 剩余 部 分 为 2 的 二 进 制 “togfyarystyng(54) 
字符 串 表示 。 该 程序 的 示例 过 程 如 右 图 所 示 。 这 es 
种 方法 可 以 推广 到 十 六 进 制 的 处 理 (或 者 其 他 进 pe 
制 )。 另 外 ， 我 们 也 关注 将 字符 串 表示 转换 为 Java tobinarystr ng 
数据 类 型 值 。 在 下 一 节 中 ， 我 们 将 学 习 一 个 完成 Pe 
此 类 转换 的 程序 。 return "1" 
ey 

当 讨论 计算 机 内 发 生 的 事情 时 ， 我 们 通常 使 return nl0 
用 的 语言 是 十 六 进 制 。 如 果 需 要 ，n 位 计算 机 的 一 了 
个 字 可 以 用 mw4 个 十 六 进 制 位 来 表示 ， 可 立即 转换 return "110110" 


return "1101101" 


A Ar > ya 
为 二 进 制 。 你 可 能 在 日 常生 活 中 已 经 观察 到 十 六 toBinaryString(109) 的 调用 过 程 


进 制 的 使 用 。 例 如 ， 当 在 网 络 上 注册 新 设备 时 ， 

需要 知道 设备 的 MAC 地 址 。 如 1a:ed:b1:b9:96:5e 可 能 就 是 一 个 MAC 地 址 ， 它 是 用 于 标识 
设备 的 48 位 二 进 制 数 的 十 六 进 制 缩写 (使 用 一 些 多 余 的 冒号 和 小 写 a 一 f， 而 非 我 们 使 用 的 
大 写 A~F)。 
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512 


hi 


(2 
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二 进 制 


00000000 
00000001 
00000010 
00000011 
00000100 
00000101 
00000110 
00000111 
00001000 
00001001 
00001010 
00001011 
00001100 
00001101 
00001110 
00001111 
00010000 
00010001 
00010010 
00010011 
00010100 
00010101 
00010110 
00010111 
00011000 
00011001 
00011010 
00011011 
00011100 
00011101 
00011110 
00011111 


FF 
进 制 


00 
01 
02 
03 
04 
05 
06 
07 
08 
09 
0A 
0B 
0C 
0D 
0E 


1F 


二 进 制 


63 


二 进 制 
00100000 
00100001 
00100010 
00100011 
00100100 
00100101 
00100110 
00100111 
00101000 
00101001 
00101010 
00101011 
00101100 
00101101 
00101110 
00101111 
00110000 
00110001 
00110010 
00110011 
00110100 
00110101 
00110110 
00110111 
00111000 
00111001 
00111010 
00111011 
00111100 
00111101 
00111110 


00111111 


3F 


十 进 制 


64 


9 
94 


95 


二 进 制 


01000000 
01000001 
01000010 
01000011 
01000100 
01000101 
01000110 
01000111 
01001000 
01001001 
01001010 
01001011 
01001100 
01001101 
01001110 
01001111 
01010000 
01010001 
01010010 
01010011 
01010100 
01010101 
01010110 
01010111 
01011000 
01011001 
01011010 
01011011 
01011100 
01011101 
01011110 


01011111 


十 六 
进 制 
40 
41 
42 
43 
44 
45 
46 
47 
48 
49 
4A 
4B 
4C 
4D 
4E 
4F 
50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
5A 
5B 
5C 
5D 
5E 


SF 


十 进 制 


96 
97 
98 


99 


120 


127 


0 一 127 之 间 整 数 的 十 进 制 、8 位 二 进 制 和 2 位 十 六 进 制 表示 


二 进 制 


01100000 
01100001 
01100010 
01100011 
01100100 
01100101 
01100110 
01100111 
01101000 
01101001 
01101010 
01101011 
01101100 
01101101 
01101110 
01101111 
01110000 
01110001 
01110010 
01110011 
01110100 
01110101 
01110110 
01110111 
01111000 
01111001 
01111010 
01111011 
01111100 
01111101 
01111110 


01111111 


+ 六 


进 制 
60 
61 
62 
63 
64 
65 
66 
67 
68 
69 
6A 
6B 
6C 
6D 
6E 
6F 
70 
71 
72 
73 
74 
5 
76 
pri 
78 
79 
7A 
7B 
7C 
7D 
7E 


7F 


十 进 制 


140 
141 
142 
143 
144 
145 
146 
147 
148 


149 


二 进 制 


10000000 
10000001 
10000010 
10000011 
10000100 
10000101 
10000110 
10000111 
10001000 
10001001 
10001010 
10001011 
10001100 
10001101 
10001110 
10001111 
10010000 
10010001 
10010010 
10010011 
10010100 
10010101 
10010110 
10010111 
10011000 
10011001 
10011010 
10011011 
10011100 
10011101 
10011110 


10011111 


于 


进 制 
80 
81 
82 
83 
84 
85 
86 
87 
88 
89 
8A 
8B 
gC 
gD 
8E 
8F 
90 
91 
92 
93 
94 
95 
96 
97 
98 
99 
9A 
9B 
9C 
9D 
9E 


oF 


十进制 


160 
161 


162 


179 


188 
189 
190 


191 


二 进 制 


10100000 
10100001 
10100010 
10100011 
10100100 
10100101 
10100110 
10100111 
10101000 
10101001 
10101010 
10101011 
10101100 
10101101 
10101110 
10101111 
10110000 
10110001 
10110010 
10110011 
10110100 
10110101 
10110110 
10110111 
10111000 
10111001 
10111010 
10111011 
10111100 
10111101 
10111110 


10111111 


is 


进 制 
A0 
Al 
A2 
A3 
A4 
A5 
A6 
A7 
A8 
A9 
AA 
AB 
AC 
AD 
AE 
AF 
BO0 
Bl 
B2 
B3 
B4 
B5 
B6 
B7 
B8 
B9 
BA 
BB 
BC 
BD 
BE 


BF 


十进制 


192 
193 
194 
195 
196 
197 
198 
199 
200 
201 
202 
203 


204 


219 


223 


二 进 制 


11000000 
11000001 
11000010 
11000011 
11000100 
11000101 
11000110 
11000111 
11001000 
11001001 
11001010 
11001011 
11001100 
11001101 
11001110 
11001111 
11010000 
11010001 
11010010 
11010011 
11010100 
11010101 
11010110 
11010111 
11011000 
11011001 
11011010 
11011011 
11011100 
11011101 
11011110 


11011111 
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= 


TN 


进 制 
C0 
E 
C2 
C3 
C4 
C5 
C6 
C7 
C8 
C9 
CA 
CB 
Ge 
CD 
CE 
CF 
D0 
D1 
D2 
D3 
D4 
D5 
D6 
D7 
D8 
D9 
DA 
DB 
DC 
DD 
DE 


DR 


十进制 


224 


225 


235 


128 一 255 之 间 整 数 的 十 进 制 、8 位 二 进 制 和 2 位 十 六 进 制 表示 


二 进 制 


11100000 
11100001 
11100010 
11100011 
11100100 
11100101 
11100110 
11100111 
11101000 
11101001 
11101010 
11101011 
11101100 
11101101 
11101110 
11101111 
11110000 
11110001 
11110010 
11110011 
11110100 
11110101 
11110110 
11110111 
11111000 
11111001 
11111010 
11111011 
11111100 
11111101 
11111110 


LETLLLIL 


513 


十 六 
进 抽 


E0 
El 
上 2 
E3 
E4 
ES 
E6 
E7 
E8 
E9 
EA 
EB 
EC 
ED 
EE 
EF 
FO 
Fl 
F2 
F3 
F4 
F5 
F6 
FY” 
F8 
F9 
FA 
FB 
FC 
FD 
FE 


FF 
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本 章 的 后 续 部 分 将 主要 关注 小 于 256 的 整数 ， 这 些 整数 可 以 用 8 位 二 进 制 或 2 位 十 六 
进 制 来 表示 。 前 文中 使 用 一 张 表 列 出 了 0 到 255 的 所 有 整数 的 十 进 制 、 二 进 制 和 十 六 进 制 表 
示 ， 以 作为 参考 。 花 费 几 分 钟 学 习 该 表 是 值得 的 ,， 它 能 够 让 你 更 有 信心 地 使 用 这 些 整 数 ， 并 
了 解 这 些 表示 形式 之 间 的 关系 。 如 果 你 已 经 熟悉 到 认为 这 个 表格 是 在 浪费 篇 幅 ， 那 么 我 们 的 
目标 就 已 经 达到 了 ! 

解析 和 字符 串 表 示 “在 整数 的 不 同 表示 方法 之 间 转 换 是 一 项 非常 有 趣 的 计算 任务 ， 我 们 
在 程序 1.3.7 中 首先 进行 了 探讨 ， 之 后 在 练习 2.3.15 中 重新 进行 了 讨论 。 我 们 也 一 直 在 使 用 
Java 的 这 种 方法 。 接 下 来 ， 为 了 巩固 各 种 基数 的 按 位 计数 表示 法 ， 我 们 来 探讨 将 任何 数字 从 
一 个 基数 转换 为 男 一 个 基数 的 程序 。 

解析 。 将 字符 串 转 换 为 内 部 表示 形式 称 为 解析 ( parsing)。 
从 1.1 节 开始 ， 我 们 一 直 在 使 用 像 Integer.parseInt() 这 样 的 
Java 方 法 以 及 类 似 StdIn.readInt( 这 样 我 们 自己 的 方法 ， 将 
输入 的 字符 串 中 的 数字 转换 为 Java 数据 类 型 的 值 。 我 们 一 


i 看 到 的 字符 
0 
2 

直 在 使 用 十 进 制 数 (使 用 0 到 9 之 间 的 字符 串 表示 )， 现 在 我 1101 
5 
6 


n 

1 1 
3 
6 110 





们 来 看 一 个 方法 ， 用 以 解析 在 任何 基数 下 的 数字 。 为 简单 起 pe 
见 ， 将 其 限制 在 不 超过 36 的 基数 上 ， 并 扩展 十 六 进 制 ， 约 ee 
定 使 用 字母 A 到 Z 表 示 从 10 到 35 的 数字 。 注 意 : Java 的 
Integer 类 有 一 个 双 参 数 的 parseInt() 方法 ， 它 具有 类 似 的 功 parselnt(1101101,2) 的 过 程 
能 ， 除 此 之 外 ， 它 也 能 处 理 负 整数 。 

现代 数据 类 型 的 特征 之 一 是 内 部 表示 被 隐藏 ， 只 能 使 用 数据 类 型 值 上 定义 的 操作 来 处 理 
数据 。 具 体 来 说 ， 最 好 是 限制 对 表示 数据 类 型 值 的 位 的 直接 引用 ， 而 是 使 用 数据 类 型 操作 来 
代替 (这样 可 以 有 效 避 人 免 不 同 处 理 器 硬件 在 底层 实现 上 的 差异 一 一 译 者 注 )。 

解析 数字 所 需要 进行 的 第 一 个 原 语 操作 是 将 字符 转换 为 整数 的 方法 。 练 习 6.1.12 给 出 
了 一 个 toInt() 方 法, 将 0~9 或 A~Z 范围 内 的 字符 作为 参数 ,返回 一 个 0~35 之 间 的 int 值 
(数字 对 应 0 一 9， 字 母 对 应 :10 一 3$ )。 有 了 这 个 原 语 ， 程 序 6.1.1 中 很 简单 就 实现 了 一 个 方法 
parseInt()， 可 以 解析 以 任意 值 b (从 2 到 36 之 间 的 整数 ) 为 基数 的 字符 串 的 整数 表示 ， 输 入 
参数 为 整数 的 字符 串 表 示 ， 并 返回 该 整数 在 Java 中 的 int 








值 。 通 常 ， 我 们 通过 一 段 循环 代码 来 计算 这 个 数字 。 每 次 循 一 站 
环 时 ，int 值 a 用 于 存储 已 经 处 理 的 所 有 字符 所 对 应 的 整数 。 在。 ， ,co ent 
每 一 次 循环 中 ，n 需要 乘 以 基数 ， 再 加 上 下 一 个 数字 的 值 。 右 。 ， ,0 pac 
边 的 例子 详细 展示 了 这 个 过 程 : 每 二 轮 循环 中 的 值 总 是 基 3 64206 Face 


数 乘 以 n 的 前 一 个 值 加 上 下 一 个 数字 (用 粗 体 标 出 )。 为 了 解 parselnt(FACE,16) 的 过 程 
析 1101101, 要 计算 0.:2+1=1,1.:2+1=3,3"2+0=6, 

6"2+1=13; 13"2+1=27;27*2+0=54 以 及 54*2+1=109。 为 了 解析 十 六 进 制 数 
FACE ， 需 要 计算 出 0. 16+15=15,15. 16+10=250，250,. 16+12=4012 和 4012 .16+ 
14 = 64 206。 这 是 通过 霍 纳 法 则 (Horner's method)( 霍 纳 法 则 在 中 国 被 称 为 秦 九 韶 算 法 。 一 一 
译 者 注 ) 进行 多 项 式 评 估 的 一 种 特殊 情况 〈 见 练习 2.1.31 ) 。 








将 一 个 自然 数 从 一 种 进 制 转换 为 男 一 种 进 制 


public class Convert 


程序 6.1.1 

















public static int toInt(char c) 
{ 从 见 练习 6.1312*/ } 
public static char toChar(int i) 

天 全 讽 练习 6:113#/ } 

public static int parseInt(String s, int d) 
{ 


int n=, 0; 

for (int 1 = 0; i < s.length(O); i++) 
n = d*n + toInt(s.charAt(i)); 

return n; 


} 
public static String toString(int n, int d) 
{ 


if (Cn == 0) return ""; 
return toString(n/d, d) + toChar(n % d); 
} 


public static void main(String[] args) 


while (!StdIn.isEmpty()) 
{ 













String s = StdIn.readStringO); 
int baseFrom = StdIn.readInt(); 
int baseTo = StdIn.readInt(); 

int n = parseInt(s, baseFrom); 
StdOut.printin(toString(n, baseTo)); 


表示 


该 通用 转换 程序 从 标准 输入 中 读 取 字 符 串 和 两 个 基数 ， 使 用 parseInt0 和 
toString0) 将 整数 在 第 一 个 基数 下 的 表示 转换 为 相同 整数 在 男 一 个 基数 下 的 
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% java Convert 
1101101 2 10 
109 


FACE 16 10 
64206 


FACE 16 2 
1111101011001110 


109 10 2 
1101101 


64206 10 16 
FACE 


64206 10 32 
1UME 






1UME 32 10 
64206 









为 简单 起 见 ， 在 这 段 代 码 中 我 们 并 未 包含 错误 检查 。 例 如 ， 如 果 由 toInt(O) 返回 的 值 不 
小 于 基数 ， 则 parseInt() 应 该 抛 出 异常 。 此 外 ， 发 生 溢出 时 也 应 该 抛 出 异常 ， 因 为 输入 的 字 


符 串 表示 的 数字 可 能 大 于 Java 中 int 可 以 表示 的 数字 。 


字符 串 表 示 。 使 用 toString() 方法 计算 一 个 数据 类 型 值 的 字符 串 表 示 也 是 本 书 开始 以 来 
一 直 在 做 的 事情 。 我 们 可 以 通过 扩展 本 节 前 面 讲 到 的 十 进 制 转 二 进 制 的 方法 来 实现 这 一 功能 
(练习 2.3.15 的 解决 方案 )， 也 是 一 种 类 似 的 递归 方法 。 用 代码 实现 计算 任何 给 定 基数 下 整数 
的 字符 串 表 示 形 式 的 方法 会 是 一 件 很 有 意思 的 事情 。 需 要 说 明 的 是 ，Java 的 Integer 类 有 一 


个 双 参 数 的 toString() 方法 可 以 实现 类 似 功能 。 

同样 ， 所 需 的 第 一 个 原 语 操作 是 将 一 个 整数 转换 为 字符 
(数字 ) 的 方法 。 练 习 6.1.13 给 出 了 三 个 toChar0 方法 ， 参 
数 为 0 一 35 之 间 的 一 个 int 值 ， 返 回 值 为 0 一 9 (对 于 小 于 10 
的 值 ) 或 A 一 Z (对 于 10 一 35 之 间 的 值 ) 之 间 的 一 个 字符 。 
有 了 这 个 原 语 ， 程 序 6.1.1 中 的 toString0 方 法 甚至 可 以 比 
parseInt() 更 简单 。 这 是 一 个 递归 方法 ， 基 本 思想 是 最 后 一 个 
数字 是 n% d 的 字符 表示 ， 而 其 余 的 字符 串 是 nd 的 字符 串 
表示 。 这 种 计算 本 质 上 是 解析 计算 的 逆向 计算 ， 正 如 以 下 所 
示 的 调用 跟踪 中 看 到 的 那样 。 


toString(64206,16) 
toString(4012,16) 
toString(250，16) 
toString(15, 16) 
toString(0, 16) 
return "" 
return "F" 
return "FA" 
return "FAC" 
return "FACE" 


toString(64206,16) 的 调用 过 程 
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在 讨论 计算 机 中 的 字 时 ， 需 要 为 它 加 上 前 导 0， 这 样 就 可 以 更 加 方便 地 描述 所 有 的 位 。 
出 于 这 个 理由 ， 在 Convert 中 包含 一 个 三 参数 版 本 的 toString0， 其 中 第 三 个 参数 是 返回 的 
字符 串 中 要 求 的 位 数 。 例 如 ， 调 用 toString(15,16,4) 返回 000F ， 调 用 toString(14,2,16) 返回 
0000000000001110。 该 版 本 的 实现 留 作 练习 ( 见 练习 6.1.15 ) 。 

程序 6.1.1 将 所 有 这 些 想 法 融合 到 一 起 ， 是 一 个 计算 两 种 进 制 之 间 数 字 的 通用 工具 。 当 
标准 输入 流 非 空 时 ,测试 客户 端的 主 循环 从 标准 输入 中 读 取 字符 串 ， 后跟 两 个 整数 (当前 字 
符 串 表示 的 基数 以 及 结果 表示 的 基数 )， 执 行 指定 的 转换 并 输出 结果 。 为 了 完成 这 项 任务 ， 
它 使 用 parseInt() 将 输入 字符 串 转换 为 一 个 Java int 型 数据 ， 然 后 使 用 toString() 将 该 Java int 
型 数据 转换 为 特定 基数 下 数字 的 字符 串 表 示 。 我 们 鼓励 你 下 载 并 使 用 此 工具 来 熟悉 数字 转换 
和 表示 。 

整数 算术 要 考虑 的 对 整数 的 第 一 个 操作 是 基本 算术 操作 ， 如 加 法 和 乘法 。 实 际 上 , 早 
期 计算 设备 的 最 初 目的 就 是 重复 执行 这 样 的 操作 。 在 下 一 章 中 ,我们 将 学 习 如 何 构 建 这 样 的 
计算 设备 ， 因 为 每 台 计 算 机 都 有 执行 这 样 操作 的 内 置 硬件 。 此 时 ， 在 小 学 时 期 学 到 的 十 进 制 
的 基本 运算 对 于 二 进 制 和 十 六 进 制 同 样 适 用 。 
加 法 。 在 小 学 时 期 已 经 学 习 过 两 个 十 进 制 数字 的 加 法 ， 规 则 是 





063 1 一 过 “将 最 低位 的 两 个 数字 (最 右边 的 数字 ) 相 加 ;如 果 和 大 于 10， 则 向 
366 前 位 进 1， 该 位 为 和 模 :10 的 余数 。 下 一 位 数字 重复 该 过 程 ， 但 要 注 
4933 意 需 要 加 上 进位 。 相 同 的 程序 可 以 扩展 到 任 一 进 二 一 进 制 
六 进 制 和 富 制 。 例 如 ,如果 使 用 十 六 进 制 ， 两 个 加 数 为 7 和 ”一 0000 
E， 那 么 该 位 为 5， 并 向 前 进位 1， 因 为 7+E 得 1 
T3345 到 十 六 进 制 的 15。 如 果 使 用 二 进 制 ， 两 个 加 数 di 
二 进 制 都 为 1， 并 且 再 加 一 个 1， 则 该 位 为 1， 并 且 向 3 0011 
0 0 01 1 生 生生 开 前 位 进 1， 因 此 1+1+1 得 二 进 制 的 11。 左 边 的 4 0100 
ee Saagl 
1001101000101 进 制 和 二 进 制 的 计算 过 程 。 同 在 小 学 时 期 学 到 的 i 
加 法 一 样 ， 我 们 会 省 略 前 导 的 零 。 7 0111 
无 符号 整数 。 如 果 要 用 一 个 计算 机 字 表 示 整 8 1000 
数 ， 那 么 可 以 表示 的 整数 的 数量 和 大 小 会 存在 限制 。 如 上 所 述 ， 用 一 个 eT 
位 的 字 ， 只 能 表示 2” 个 整数 。 如 果 只 需要 非 负 (或 无 符号 ) 整数 ， 通 常 10 1010 
的 选择 是 使 用 带 有 前 导 零 的 二 11 .1011 
位 数 。 最 小 什 最 大 值 进 制 表示 整数 0 到 2"-1， 这 12 1100 
4 0 15 样 每 个 字 都 对 应 一 个 整数 ， 在 13 ,st3301 
16 0 65 535 定义 范围 之 内 的 每 一 个 整数 都 14 ~ 1110 
32 0 4 294 967 295 对 应 一 个 字 。 右 表 所 示 为 一 个 4b 和 和 
64 0 18 446 744 073.709 551615 4 位 的 字 所 能 表示 的 16 个 无 4 位 整数 (无 符号 ) 
能 表示 的 无 符号 整数 符号 数 ， 左 表 所 示 为 典型 的 计 
算 机 中 使 用 的 16 位 、32 位 、64 位 的 字 所 能 表示 
的 整数 的 范围 。 


溢出 。 如 在 ;1.2: 节 中 看 到 的 Java 编程 一 样 ， 需 要 注意 确保 算术 运算 结果 不 超过 能 够 存 
储 的 最 大 值 。 超 过 最 大 值 的 情况 被 称 为 溢出 (overflow) 。 对 于 无 符号 整数 的 加 法 ， 溢 出 很 容 


欧 建 一 台 计 盆 机 517 


易 检测 : 如 果 最 后 一 次 (最 左边 的 位 ) 加 法 产生 了 进位 ， 则 
结果 太 大 ， 将 无 法 表示 。 即 使 是 在 计算 机 硬件 中 (后 面 将 会 
见 到 )， 检 查 一 个 数位 的 值 也 很 容易 ， 所 以 计算 机 和 编程 语 
言 通常 都 提供 测试 这 种 可 能 性 的 低级 指令 。 值 得 注意 的 是 ， 
Java 并 没有 提供 这 样 的 功能 (参见 1.2 节 中 的 问答 环节 )。 


进位 表示 
有 
1000000111111000 
TE EE0U00 
0000000000001000 
0000000000000000 


乘法 。 类 似 地 ， 如 右 图 所 示 ， 小 学 学 到 的 乘法 算法 也 
完美 适用 于 任何 进 制 (二 进 制 的 例子 很 难 跟踪 ， 因 为 会 产 


溢出 ( 16 位 无 符号 数 ) 


十 进 制 











生 大 量 的 级 联 进位 ;如果 你 真 想 试 试看 ， 你 可 以 做 一 次 加 
2 操作 )。 实 际 上 ， 计 算 机 科学 家 已 经 发 现 了 一 种 乘法 算法 ， 27402 
相 比 之 下 ， 这 种 算法 更 适合 在 计算 机 中 实现 ， 并 且 更 加 有 和博 并 
效 。 在 早期 的 计算 机 中 ， 程 序 员 不 得 不 在 软件 中 进行 乘法 1671522 
运算 ( 稍 后 在 练习 6.3.35 中 会 演示 这 种 实现 方式 )。 要 注 直 Xi 过 制 1 110， 
意 ， 相 比 加 法 运算 ， 开 发 乘法 算法 时 溢出 是 一 个 更 大 的 问 * 16E 
题 ， 因 为 结果 中 的 位 数 可 能 达到 操作 数位 数 的 两 倍 。 也 就 二 
是 说 ， 当 两 个 n 位 的 数字 相 乘 时 ， 需要 为 结果 准备 2n 位 。 11D7 
本 书 无 法 深入 描述 使 用 计算 机 硬件 执行 算术 运算 的 所 198162 
有 技术 。 当 然 ， 你 希望 计算 机 能 有 效 地 执行 除法 、 求 竺 及 “下 1010111 
其 他 操作 ， 而 我 们 计划 详细 说 明 加 /减法 ， 简 要 介绍 其 他 on 
操作 。 i00611 EO0F0L11 
除 无 符号 整数 外 ， 你 也 希望 能 够 用 负数 和 实数 进行 计 区 
算 。 接 下 来 将 简要 描述 为 了 支持 这 些 操 作 而 使 用 的 标准 表 1000111010111 
示 方 法 。 1000111010111 
负数 ”计算 机 设计 人 员 早 期 发 现 ， 通 过 使 用 称 为 二 进 “了 061105000T01T000TT 
制 补 码 ( two’s complement) 的 表示 法 ,修改 整数 数据 类 型 乘法 示例 
使 其 可 以 支持 负数 并 不 是 很 困难 。 We be 
我 们 可 能 会 想到 的 第 一 种 方法 就 是 符号 加 数值 ( sign- 二 
and-magnitude) 表示 法 ， 其 中 第 一 位 表示 符号 ， 剩 余 位 表 1 0001 
示 数 字 的 值 。 例 如 ,使 用 4 位 表示 时 ，0101 表示 +5，1101 2 0010 
表示 -5。 相 比 之 下 ， 在 一 个 n 位 的 二 进 制 补 码 中 ， 正 数 的 3 0011 
表示 方法 与 之 前 相同 ， 负 数 -x 使 用 二 进 制 数 2"-x 表示。 4 0100 
例如 ， 右 表 所 示 为 一 个 4 位 的 字 使 用 二 进 制 补 码 所 能 表示 和 
的 16 个 整数 。 可 以 看 出 0101 仍然 表示 +5， 但 是 1011 表 et 
示 =5， 因 为 2-5=1110=10112s 8 1000 
由 于 保留 了 一 个 符号 位 ， 所 以 使 用 二 进 制 补 码 所 能 表 -7 1001 
示 的 整数 数量 约 为 使 用 相同 比特 数 所 能 表示 的 无 符号 整数 -6 ol0 
数量 的 一 半 。 从 4 位 示例 中 可 以 看 出 ,二进制 补 码 中 存在 -5 六 二 
轻微 的 不 对 称 : 4 位 可 以 表示 1~7 的 正 数 、-8 一 -1 的 负数 这 计 幅 于 
以 及 0。 一 般 来 说 ， 在 位 二 进 制 补 码 中 ,能够 表示 的 最 二 
小 负数 为 =2”!， 最 大 正 数 为 2"1-1。 下 表 所 示 为 16 位 二 进 类 半 ， 放量 


制 补 码 所 能 表示 的 最 小 和 (绝对 值 ) 最 大 整数 值 。 4 位 整数 ( 二进制 补 码 ) 
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十 进 制 二 进 制 





0 0000000000000000 
1 0000000000000001 
2 0000000000000010 
3 0000000000000011 


0111111111111101 
0111111111111110 
0111111111111111 
-32768 1000000000000000 
-32767 1000000000000001 
-32766 1000000000000010 
-32765 1000000000000011 


-3 1111111111111101 
-2 1111111111111110 
法 :5 A11111I111114 
16 位 整数 (二 进 制 补 码 ) 


二 进 制 补 码 能 够 胜 过 符号 加 数值 表示 法 成 为 标 
准 有 两 个 主要 原因 。 第 一 ， 因 为 0 只 有 一 种 表示 方法 
(全 为 0 的 三 进 制 串 )， 所 以 检验 是 否 为 0 会 非常 简单 。 
第 二 ， 算 术 操 作 会 很 容易 实现 一 一 稍 后 本 节 将 讨论 这 
一 点 。 另外 ,在 符号 加 数值 表示 法 中 ， 前 导 位 表示 符 
号 ， 因 此 检验 一 个 值 是 否 为 负 会 非常 简单 。 事 实 上 ， 
构建 计算 机 硬件 是 一 个 非常 困难 的 过 程 ， 因 此 ， 如 果 
一 个 数字 表示 方法 的 规则 能 够 简化 这 个 过 程 ， 那 么 这 
无 疑 是 一 个 非常 有 意义 的 改进 。 

加 法 。 将 两 个 n 位 二 进 制 补 码 整数 相 加 也 很 容 
易 : 使 用 无 符号 整数 加 法 规则 将 其 相 加 。 例 如 ，2+(- 
7)=0010+1001=1011=-5。 证 明 结 果 仍 然 在 范围 内 
(-2”"'~2"'-1 ) 并 不 困难 : 

。 如 果 两 个 整数 都 为 非 负 ， 则 只 要 结果 (绝对 值 ) 

小 于 2， 标准 二 进 制 加 法 就 仍然 适用 。 


0000000000000000 
0000000001000000 


0000000000101010 


0000000001101010 


1111111111000000 
0000000001000000 
1111111111010110 


0000000000010110 


0000000000000000 
1111111111000000 
0000000000101010 


L111LIT1ILLI1I1IONLO 


F111111111000000 
1111111111000000 
TFI1EF11LEOTOL LO 


1111111110010110 
加 法 ( 16 位 二 进 制 补 码 ) 


。 如 果 两 个 整数 都 为 负 ， 则 和 为 : (2"-=x)+(2"-y)=2"+2"- (x+y)s 
。 如 果 x 为 负 ; ?为 正 ， 且 结果 为 负 ， 则 有 : (2"-x)+y=2” (x-y)。 
。 如 果 x 为 负 , yy 为 正 ; 且 结 果 为 正 ， 则 有 : (2” -x)+y=2”+ (一 x)。 
在 第 二 种 和 第 四 种 情况 下 ，2” 项 不 会 对 nn 位 的 结果 产生 影响 (2" 超 出 了 nn 位 二 进 制 数 
的 表示 范围 ， 且 低 n 位 二 进 制 数 全 是 0， 因 此 对 低位 不 产生 任何 影响 一 一 译 者 注 )， 所 以 标 
准 二 进 制 加 法 (忽略 进位 ) 可 以 得 出 正确 的 结果 。 溢出 检测 比 无 符号 整数 更 加 复杂 ， 我 们 将 


其 留 到 问答 环节 。 
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0000000000001010 ,10，， “减法 。 要 计算 xy， 我 们 计算 x+(-7)。 也 就 是 说 ， 
.0000000000000001 Wn 如 果 知道 如 何 计算 起 ， 就 仍然 可 以 使 用 二 进 制 加 法 。 结 


11TTILETIELIO0110 ;SI 果 表 明 ， 在 三 进 制 补 码 中 求 一 个 数字 的 相反 数 非常 简单 : 





取 反 ， 加 1。 该 过 程 的 三 个 示例 如 左 图 所 示 我 们 将 
113t 1 EELSE0110 -10 证 明 留 作 练习 。 
0 ob 9 立 
.000 00 a Java 程序 员 也 需要 了 解 二 进 制 补 码 的 相关 原理 ， 因 


0000000000001010 10 为 short、int 和 long 型 值 分 别 使 用 16 位 、32 位 和 64 位 
的 二 进 制 补 码 来 表示 负 整 数 。 这 也 解释 了 Java 程序 员 为 
0001001101001110 4942 ”什么 必须 知道 这 些 类 型 值 的 界限 (如 下 图 所 示 )。 
1110110010110001 翻 转 所 有 位 男 外 ，Java 的 二 进 制 补 码 表示 方法 解释 了 在 1.2 
90000000000000u ui， 节 中 观察 到 的 游 出 现象 ( 见 1.2 节 问答 环节 及 练习 
用 二 进 制 补 码 求 数字 的 相反 数 1.2.10 )。 在 该 示例 中 可 以 看 到 ， 对 于 任意 Java 整数 
类 型 ， 最 大 正 整 数 加 1 的 结果 是 最 大 负 整 数 。 在 4 位 
二 进 制 补 码 中 ，0111 加 工 得 到 1000; 在 16 位 二 进 制 补 码 中 ,0111111111111111 加 1 得 到 
1000000000000000 (注意 这 是 对 二 进 制 补 码 整 数 加 1 不 会 产生 预期 结果 的 唯一 情形 )。 练 
习 1.2.10 中 的 其 他 情形 也 可 以 得 到 解释 。 几 十 年 来 ， 这 样 的 行为 让 那些 没有 花费 时 间 去 了 
解 二 进 制 补 码 的 程序 员 不 知 所 措 。 下 面 是 一 个 有 说 服 力 的 例子 : 在 Java 中 ,调用 Math.abs 
(-2 147 483 648 ) 却 返 回 -=2 147 483 648 ， 一 个 负 整 数 ! 


最 小 什 — 32 768 
全 最 人 全 32 767 
32 位 最 小 值 -2 147 483 648 
最 大 什 2 147 483 647 
Gaty 。 最小 秆 9 223 372 036 854 775 808 


最 大 值 9 223 372 036 854 775 807 
二 进 制 补 码 所 能 表示 的 整数 


实数 ”如 何 表 示 实 数 呢 ?” 这 个 任务 比 表示 整数 更 有 挑战 ， 因 为 必须 做 出 很 多 选择 。 在 
数字 计算 发 展 的 头 二 十 年 ， 早 期 计算 机 设计 者 尝试 了 很 多 选择 ， 演 变 出 很 多 种 不 同 的 存储 格 
式 。 实 数 运算 很 长 时 间 内 都 只 能 在 软件 上 实现 ， 且 与 整数 运算 相 比 非常 慢 。 

到 20 世纪 80 年 代 中 期 ， 对 标准 的 需求 越 来 越 强烈 (不同 的 计算 机 可 能 会 在 相同 的 计算 
中 得 到 略微 不 同 的 结果 )， 所 以 电气 和 电子 工程 师 协会 (IEEE) 开发 了 IEEE 754 标准 ， 这 个 
未 未 尔 可 能 不 会 想 了 解 它 的 全 部 细节 一 一 
但 我 们 可 以 在 此 简要 描述 其 基本 想法 。 我 们 将 16 位 版 本 称 作 IEEE 754 的 半 精 度 二 进 制 浮 点 
数 格式 ， 简 称 为 binary16。 相 同 的 基本 思想 同样 适用 于 Java 中 使 用 的 32 位 和 64 位 版 本 。 

浮 点 数 。 在 计算 机 系统 中 常用 的 实数 表示 法 是 浮 点 数 。 它 就 像 科 学 计数 法 一 样 ， 不 同 之 
处 在 于 所 有 的 数字 都 用 二 进 制 表示 。 在 科学 计数 法 中 ， 我 们 习惯 使 用 





类 似 +6.022 141 3 x 102 的 数字 ， 这 样 的 数字 包括 符号 、 系 数 和 指数 。 -wp 恒 为 ] 
通常 ， 该 数字 被 表示 时 系数 为 一 个 ( 非 零 ) 数字 。 这 种 表示 方法 称 为 人 1， Ta 
标准 化 条 件 (normalization condition)( 即 要 求 系 数 是 一 个 小 于 基数 的 ”符号 小 数 


数字 。 一 一 译 者 注 )。 在 浮 点 数 中 ， 同 样 也 需要 这 三 个 元 素 。 剖析 浮 点 数 
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符号 。 浮 点 数 的 第 一 位 是 它 的 符号 (sign)。 符 号 位 为 0 时 ， 数 字 为 正 (或 零 )， 如 果 为 1 
则 为 负 。 检查 一 个 数字 是 正 还 是 负 很 容易 。 ni 
指数 。 浮 点 数 毛 下 来 的 t 位 用 于 表示 其 指数 。binary16、 二进制 一 进 制 _ 


binary32 和 binary64 表示 指数 的 位 数 分 别 为 5 位 、8 位 、11 位 。 浮 3 Es 
点 数 的 指数 不 使 用 二 进 制 补 码 表示 ， 而 是 使 用 偏 移 二 进 制 码 (offset ee 
binary) 表示 ， 其 中 分 别 取 t= 5、8、11 时 的 R=2"-1(t= 5、8、 .00 0 0 Hod 
11 分 别 对 应 15、127、1023);， 用 x + RR 的 二 进 制 表示 -~R~R+1 之 900000100 
间 的 任意 十 进 制 整数 x。 右 表 所 示 为 -15 一 +16 之 间 所 有 整数 的 5 位 -10 00101 
偏 移 二 进 制 码 表示 。 在 标准 中 ，0000 和 1111 用 于 其 他 目的 。 -9 00110 
小 数 。 浮 点 数 中 剩余 位 用 于 表示 系数 : binary16、binary32 和 -8 00111 
binary64 分 别 用 10 位 、23 位 、53 位 来 表示 。 标 准 化 条 件 意味 着 系数 = 01000 
中 小 数位 前 的 数字 始终 为 1， 因此 我 们 不 需要 在 表示 中 包含 该 数字 ! 册 01001 
给 定 这 些 规则 ， 对 以 3 WD 

偏 移 二 进 制 码 指数 (5 位 ) IEEE 754 格式 编码 的 数字 进行 《中 订 午 各 3 

符号 (1 位 ) CE 解码 的 过 程 就 变 得 很 简单 ， 如 Oooodoe 
人 (10 位 】 et erties 根据 标 2T 01110 

IEEE 754 半 精 度 浮 点 数 格式 ipt he 0 01111 
符号 ， 接 下 来 的 五 位 是 指数 E 10000 

( -610 ) 的 偏 移 二 进 制 编码 ， 接 下 来 的 10 位 是 小 数 ， 其 定义 了 系数 2 10001 
1.1012。 由 底部 示例 所 示 ， 编 码 过 程 相对 较为 复杂 ， 这 是 由 于 需要 标 3 10010 
准 化 并 扩展 二 进 制 转换 使 其 包含 小 数 。 同 样 ， 第 一 位 是 符号 位 ， 接 下 4 10011 
来 的 5 位 是 指数 ， 再 接 下 来 的 10 位 是 小 数 。 这 些 任务 即使 在 像 Java 3 10100 
这 样 的 高 级 语言 中 也 是 一 个 具有 挑战 性 的 编程 练习 (参见 练习 6.1.25， 6 2 
但 首先 阅读 下 一 小 节 中 的 位 操作 )， 所 以 你 可 以 想象 为 什么 早期 计算 | 
机 硬件 不 支持 浮 点 数 以 及 为 什么 要 花 这 么 长 的 时 间 来 发 展 标准 。 ebb 
IEEE 754 转 换 为 十 进 制 10 11001 
1010011010000000 me 11010 

bs 11011 

-2*5x1:101, = ~25(1+2"+23)=-0.0253906250,。 ey 站 

14 11101 

15 T1199 


十 进 制 转换 为 IEEE 754 


100.25。= 25(1 +2-+2-4+2-8=+22-5x1.10010001， 4 A 
5 位 整数 ( 偏 移 二 进 制 码 ) 





0101011001000100 
浮 点 数 与 十 进 制 相互 转换 的 例子 
Java 的 Float 和 Double 数据 类 型 都 包含 floatToIntBits() 方法 ， 可 以 使 用 这 个 方法 检查 
浮 点 数 编码 。 例 如 ， 调 用 
Convert.toString(Float.floatToIntBits(100.25), 2，16) 


将 输出 结果 : 0101011001000100, 与 上 面 第 二 个 例子 的 预期 结果 相同 。 
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算术 运算 。 对 浮 点 数 进行 算术 运算 也 可 以 作为 有 趣 的 编程 练习 。 例 如 ， 两 个 浮 点 数 相 乘 
需要 以 下 步骤 : 

。 确定 符号 。 

。 将 指数 相 加 。 

。 将 小 数 相 乘 。 

。 将 结果 标准 化 。 

如 果 有 兴趣 ， 你 可 以 研究 以 下 该 过 程 的 细节 ， 并 通过 完成 练习 6.1.25 研究 相应 的 加 法 
和 乘法 过 程 。 加 法 实际 上 比 乘法 复杂 得 多 ， 因 为 第 一 步 需要 “ 非 标准 化 ” 使 得 指数 匹配 。 

使 用 浮 点 数 进行 计算 通常 具有 挑战 性 ， 因 为 它们 大 部 分 都 是 我 们 真正 想 处 理 的 实数 的 近 
似 值 ， 近 似 值 的 误差 会 在 长 期 的 计算 过 程 中 累积 。 由 于 64 位 格式 (Java 中 double 数据 类 型 
所 使 用 的 ) 具有 32 位 格式 ( Java 中 float 数据 类 型 所 使 用 的 ) 两 倍数 量 的 位 数 ， 大 多 数 程序 
员 会 选择 使 用 double 以 减少 近似 误差 的 影响 ， 本 书 中 也 是 这 么 做 的 。 

用 于 操作 二 进 制 位 的 Java 代码 ”从 实数 的 浮 点 数 编码 中 可 以 看 出 ,使 用 三 进 制 编码 信 
息 可 能 会 变 得 非常 复杂 。 接 下 来 ， 我 们 将 介绍 在 Java 中 可 以 使 用 的 工具 ， 这 些 工具 将 有 助 
于 信息 编 解码 程序 的 开发 。Java 将 整数 值 定义 为 二 进 制 补 码 形式 ， 并 明确 指出 short 、int、 
long 数据 类 型 的 值 分 别 为 16 位 、32 位 、64 位 二 进 制 补 码 ， 这 是 这 些 工 具 能 够 正常 工作 的 基 
础 。 并 非 所 有 的 语言 都 能 这 样 做 ， 有 些 语言 将 这 类 功能 的 代码 留 到 更 低级 语言 实现 ， 有 些 语 
言 为 比特 序列 定义 了 一 种 明确 的 数据 类 型 ， 或 者 可 能 需要 进行 困难 或 代价 较 高 的 转换 。 我 们 
主要 介绍 关于 32 位 int 型 值 的 操作 ， 但 这 些 操作 对 short 和 long 型 值 也 适用 。 

二 进 制 和 十 六 进 制 常量 〈literal)。 在 Java 中 ， 可 以 用 二 进 制 (需要 前 级 0b) 和 十 六 进 
制 (需要 前 级 0x) 指定 整数 型 常量 值 。 这 是 两 种 直接 使 用 二 进 制 编码 声明 常量 值 的 方式 。 你 
可 以 在 任何 使 用 十 进 制 常量 的 地 方 使 用 这 样 的 常量 ， 它 仅仅 是 指定 整数 值 的 男 一 种 方式 。 如 
果 你 给 一 个 int 型 变量 指定 一 个 十 六 进 制 常量 ， 并 且 位 数 少 于 8， 则 Java 将 自动 在 前 面 补 0。 
下 面 展示 了 九 个 例子 。 

二 进 制 常 量 十 六 进 制 常量 ”简写 
0b01000000010101000100111101011001 0x40544F59 
Ob11111111111111111111111111111111 OQx0000000F OxF 


0b00000000000000000001001000110100 0x00001234 0x1234 
0b00000000000000001000101000101011 0x00008A2B Ox8A2B 


Java 代码 中 的 移 位 和 按 位 运算 。 为 了 允许 客户 端 能 够 针对 一 个 int 型 变量 的 位 进行 操 
作 ，Java 支持 下 面 所 列 出 的 类 似 操作 。 我 们 可 以 进行 取 反 (将 0 变 为 1， 将 1 变 为 0)、 按 位 
逻辑 操作 (应 用 后 面 定 义 的 比特 对 的 and、or、xor 函数 )、 左 移 或 右 移 一 定数 量 的 位 。 对 于 
右 移 ， 有 两 种 选择 : 逻辑 移 位 (1logical shift)， 其 中 用 .0 在 左 端 补足 ; 算术 移 位 (arithmetic 
shift)， 空 出 的 位 置 用 符号 位 填充 ( 见 本 节 末 的 问答 环节 )。 操 作 示 例如 下 图 所 示 。 





32 位 整数 
值 
典型 常量 0b00000000000000000000000000001111 0b1111 0xF 0x1234 
操作 取 反 按 位 与 ” 按 位 或 ” 按 位 异 或 左 移 “ 右 移 (逻辑 ) 右 移 (算术 ) 
操作 符 ~ & | 入 << >>> >> 


Java 内 置 int 数据 类 型 的 位 操作 操作 符 
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移 位 和 掩 码 。 这 类 操作 的 主要 用 途 之 一 是 掩 码 (masking)， 使 用 掩 码 可 以 将 某 一 位 或 某 


一 组 位 与 同一 字 中 的 其 他 位 区 分 开 。 通 常情 况 
下 更 愿意 用 十 六 进 制 常 量 表示 掩 码 。 例 如 ， 掩 
码 0x80000000 可 以 用 于 在 32 位 字 中 隔离 最 左 
端 一 位 ， 掩 码 0x000000FF 可 用 于 隔离 最 右边 
的 8 位 ， 掩 码 0x007FFFFF 可 用 于 隔离 最 右 端 
的 23 位 。 

再 深入 一 点 ， 我 们 通常 使 用 移 位 和 掩 码 提 
取 一 组 连续 位 所 表示 的 整数 值 ， 如 下 : 

。 使 用 右 移 指令 将 位 放置 于 最 右 端 。 

。 如果 我 们 想 要 k 人 位， 创建 一 个 常量 掩 

码 ， 最 右 端 上 位 为 1， 其 余 位 皆 为 0。 

。 使 用 按 位 与 操作 ， 并 将 这 大 位 与 其 他 数 

据 分 开 。 掩 码 中 的 0 会 使 结果 中 都 为 
0， 掩 码 中 的 1 会 使 结果 中 出 现 我 们 感 
兴趣 的 位 。 

这 个 操作 序列 使 我 们 能 够 像 使 用 任何 其 他 
int 值 一 样 使 用 结果 ， 这 通常 也 正 是 我 们 想 要 
的 。 在 本 章 的 后 面 我 们 将 关注 移 位 和 掩 码 以 隔 
离 十 六 进 制 数 字 ， 如 下 面 右 图 所 示 。 


X AND(x,y) OR(x,y) XOR(CX,Yy) 





按 位 操作 定义 的 真 值 表 


取 反 
~ 01010001110101110000000000001111 
101011100010100011111113111110000 
按 位 与 
01010001110101110000000000001111 
& 00110001011011100011000101101110 
00010001010001100000000000001110 
按 位 或 
01010001110101110000000000001111 
| 00110001011011100011000101101110 
01110001111111110011000101101111 
01010001110101110000000000001111 
A 00110001011011100011000101101110 
01100000101110010011000101100001 
左 移 6 位 
01010001110101110000000000001111 
<<00000000000000000000000000000110 
01110101110000000000001111000000 
右 移 6 位 
01010001110101110000000000001111 
>>00000000000000000000000000000011 
00001010001110101110000000000001 
移 位 和 按 位 操作 ( 32 位 ) 


表达 式 值 
0x00008A2B >> 8 0x0000008A 
(0x00008A2B >> 8) & OxF 0x0000000A 
移 位 和 掩 码 示 例 


作为 按 位 操作 的 实际 应 用 示例 ， 程 序 6.1.2 说 明了 如 何 使 用 移 位 和 掩 码 来 从 浮 点 数 中 提 
取 符 号 、 指 数 和 小 数 。 大 多 数 计算 机 用 户 可 以 不 必 处 理 此 级 别 的 数据 表示 ， 仍 然 能 够 顺利 地 
完成 自己 的 编程 任务 (实际 上 在 本 书 中 ， 至 今 为 止 我 们 根本 就 不 需要 这 样 做 )， 但 是 ， 如 你 
所 见 ， 位 操作 在 各 种 应 用 中 起 着 重要 的 作用 。 

字符 ”为 了 处 理 文本 ， 我 们 需要 对 字符 进行 二 进 制 编码 。 基 本 方法 相当 简单 : 有 一 个 表 
定义 了 字符 和 位 无 符号 二 进 制 整 数 之 间 的 对 应 关系 。 如 果 我 们 使 用 6 位， 可 以 编码 64 个 
不 同 的 字符 ; 使 用 7 位， 可 以 编码 128 个 不 同 字符 ; 使 用 8 位 ， 可 以 编码 256 个 不 同 字符 等 。 
与 浮 点 数 一 样 ， 随 着 计算 机 的 演变 ， 许 多 不 同 的 方案 投入 使 用 ， 人 们 在 不 同情 况 下 仍然 在 使 
用 各 种 不 同 的 编码 。 

ASCII。 美 国信 息 交 换 标 准 代 码 (American Standard Code for Information Interchange， 
ASCII) 在 20 世纪 60 年 代 被 作为 标准 提出 ， 从 那 以 后 便 得 到 广泛 使 用 。 虽 然 在 现代 计算 中 
通常 用 8 位 的 字 节 存储 数据 ， 但 它 是 一 种 7 位 码 ， 最 前 一 位 通常 会 被 忽略 。 
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程序 6.1.2“ 提取 浮 点 数 的 组 成 部 分 


public class ExtractFloat 











public static void main(String[] args) 





float x = Float.parseFloat(args[0]); 
int t = Float.floatToIntBits(x); 


if ((t & 80000000) == 1) StdOut.printin("Sign: 
else Stdout.println("Sign: 


int exponent = ((t >> 23) & OxFF) - 127; 
StdOut.printin("Exponent: ”+ exp); 

double fraction = 1.0 * (t & 0x007FFFFF) / (1 << 23); 
double mantissa = 1.0 + fraction; 
StdOut.printin("Mantissa: ”+ mantissa); 





wt 
J 








StdOut.printin(mantissa * (1 << exponent)); 






该 程序 表明 了 Java 位 操作 的 用 法 ， 对 从 命令 行 参数 中 输入 的 浮 点 数 提取 其 符 
号 、 指 数 和 小 数 ， 然 后 使 用 指数 和 小 数 重新 计算 数字 的 绝对 值 。 







% java ExtractFloat -100.25 
Sign: - 

Exponent: 6 

Mantissa: 1.56640625 

100.25 








ASCII 码 被 提出 的 初衷 是 通过 电 传 打字 机 (teletypewriter) 进行 通信 ， 电 传 打字 机 可 以 
发 送 并 接收 文本 。 因 此 ， 许 多 编码 字符 都 是 这 种 机 器 的 控制 字符 。 一 些 控制 字符 是 通信 协议 
的 一 部 分 (例如 ,ACK 意味 着 “确认 ”)， 其 他 字符 控制 机 器 的 输出 (例如 ,BS 意味 着 “ 退 格 ”， 
CR 代表 “ 回 车 ”)。 

下 表 是 ASCII 码 的 一 种 定义 ， 其 中 提供 了 8 位 二 进 制 码 (也 就 是 2 位 十 六 进 制 ) 与 一 个 
字符 之 间 相 互 转换 的 对 应 关系 。 使 用 第 一 个 十 六 进 制 数字 索引 行 ， 第 二 个 十 六 进 制 数字 索 
引 列 ， 可 以 找到 其 编码 的 字符 。 例 如 ，31 编码 了 数字 1，4A 编码 了 字母 等 。 该 表 为 7 位 
ASCII 码 ， 所 以 第 一 位 十 六 进 制 数字 必须 小 于 或 等 于 7。 以 0 或 1 开头 的 十 六 进 制 数 字 【《 以 
及 20 和 7F) 对 应 的 ASCII 码 是 非 打 印 控制 字符 ， 如 CR， 现 在 意味 着 “换行 符 ” (其 他 大 部 
分 已 经 很 少 在 现代 计算 中 使 用 )。 





十 六 进 制 与 ASCII 码 之 间 的 转换 表 
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Unicode。 在 21 世纪 的 互联 网 世界 中 ， 常 常 需要 处 理 比 来 自 20 世纪 的 ASCII 字符 更 多 
的 字符 ， 所 以 一 种 新 的 名 为 Unicode 的 编码 标准 出 现 。 通 过 对 大 多 数字 符 使 用 16 位 (对 于 
某 些 字符 最 多 可 以 使 用 24 位 或 32 位 ),Unicode 可 以 支持 数 以 万 计 的 字符 和 大 量 的 世界 语言 。 
UTF-8 编码 (能 够 将 字符 序列 编码 为 8 位 字 节 序列 ， 反 之 亦 然 ， 大 多 数字 符 可 映射 到 两 字 
节 ) 迅速 作为 一 种 标准 出 现 。 这 些 规则 复杂 而 又 全 面 ， 它 们 在 大 多 数 现代 系统 (如 Java) 中 
得 到 了 支持 ， 所 以 程序 员 通 常 不 用 担心 细节 。ASCII 在 Unicode 内 得 到 了 兼容 : 所 有 ASCII 
字符 映射 到 1 字 节 ， 因 此 ASCII 文 件 是 UTF-8 文件 的 特殊 情况 〈 向 后 兼容 )。 

我 们 通常 将 尽 可 能 多 的 信息 打包 到 一 个 计算 机 字 -ASCIT( 两 个 字符 ) 到 二 进 制 
中 ， 因 此 可 以 用 16 位 编码 两 个 ASCII 字符 (如 右 图 所 再 
示 )、32 位 编码 (四 个 字符 )、64 位 编码 ( 八 个 字符 ) 等 。 








ey 0101000001000011 
在 Java 这 样 的 高 级 语言 中 ， 这 些 细节 和 UTF-8 编 解码 “jsoni 而 个 字符 ) 
在 String 数据 类 型 中 实现 ， 在 本 书 中 会 一 直 使 用 。 然 ao 和 En 
而 ， 对 于 Java 程序 员 而 言 ， 更 重要 的 是 了 解 一 些 关 于 
信息 表示 的 基本 事实 ， 因 为 它 会 影响 程序 的 资源 需求 。 wy 
例如 ， 许 多 程序 员 发 现 ， 自 2000 年 当 Java 从 ASCII ASCII 与 二 进 制 转换 示例 


切换 到 Unicode 时 ， 他 们 程序 的 内 存 使 用 量 突然 翻 倍 ,并 开始 使 用 16 位 的 char 来 对 每 个 
ASCII 字符 进行 编码 。 有 经 验 的 程序 员 知 道 如 何在 每 个 char 中 打包 两 个 ASCII 字符 ， 以 便 
在 必要 时 节省 内 存 。 

总 结 一 般 来 说 ,编写 能 够 正确 独立 于 数据 表示 的 程序 是 明智 之 举 。 许 多 编程 语言 完全 
支持 这 一 观点 。 不 幸 的 是 ,通过 这 种 方法 得 出 的 硬件 使 用 方式 ， 则 直接 站 在 了 充分 利用 计算 
机 能 力 的 对 立 面 。Java 的 原始 类 型 旨 在 支持 这 一 观点 。 例 如 ， 如 果 计 算 机 拥有 能 够 实现 64 
位 整数 加 法 或 乘法 的 硬件 ， 那 么 我 们 希望 将 每 个 加 法 或 乘法 运算 减少 到 单个 指令 ， 以 便 我 们 
的 程序 尽 可 能 快 地 运行 。 因此， 程序 员 尝 试 将 具有 性 能 关键 操作 的 数据 类 型 与 在 计算 机 硬件 
中 实现 的 原始 类 型 进行 匹配 是 明智 的 。 实 现实 际 匹配 可 能 会 需要 更 深入 地 了 解 你 的 系统 及 其 
软件 ,但 为 了 获得 最 佳 性 能 这 肯定 是 值得 的 。 

你 编写 的 程序 可 能 一 直 是 在 使 用 各 种 数据 类 型 进行 计算 。 我 们 在 本 节 中 提供 的 消息 是 ， 
由 于 每 个 比特 序列 都 可 以 以 许多 不 同 的 方式 解释 ,计算 机 内 任何 给 定 的 比特 序列 的 含义 取决 
于 上 下 文 。 你 可 以 编写 程序 并 以 任何 你 想 要 的 方式 来 解释 位 。 随 着 编程 的 过 程 你 会 看 到 ， 你 
不 能 只 根据 使 用 的 位 数 来 判断 它们 的 数据 类 型 ， 甚 至 都 不 能 确定 它们 是 不 是 数据 。 

为 了 进一步 强调 这 一 点 ， 下 表 给 出 了 几 个 不 同 的 16 位 值 ， 以 及 如 果 被 解释 为 二 进 制 整 
数 、 十 六 进 制 整数 、 无 符号 整数 、 二 进 制 补 码 整数 .binary16 浮 点 数 和 ASCII 字符 对 应 的 值 。 
这 些 只 是 在 计算 机 中 表示 信息 的 无 数 可 用 方法 的 几 个 较为 简单 的 例子 。 





二 进 制 十 六 进 制 无 符号 整数 “二 进 制 补 码 浮 点 数 (binary16 ) ASCII 字 符 
0001001000110100 1234 4660 4660 0.0007572174072265625 DC2 4 
1111111111111111 FFFF 65535 = 二 —131008.0 DEL DEL 
1111101011001110 FACE 64206 -1330 一 55744.0 en 
0101011001000100 5644 22052 22 052 100.25 VD 
1000000000000001 8001 32769 一 32 767 一 0.0000305473804473876953125 NUL SOH 
0101000001000011 5043 20547 20 547 34.09375 PC 
0001110010101011 1CAB 7339 7 339 0.004558563232421875 FS+ 


解释 16 位 值 的 6 种 不 同方 式 
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问答 环节 

问 : 如 何 找 出 计算 机 中 字 的 大 小 ? 

答 : 需要 找到 处 理 器 名 称 ， 然 后 查找 处 理 器 规格 。 你 最 可 能 拥有 的 是 一 个 64 位 的 处 理 
器 。 如 果 不 是， 是 时 候 换 一 台新 计算 机 了 。 

问 : 在 大 多 数 计算 机 都 是 用 64 位 字 的 情况 下 ， 为 什么 Java 的 int 值 使 用 32 位 ? 

答 : 这 是 很 久 以 前 的 设计 决策 。Java 不 同 于 其 他 常规 的 编程 语言 ， 因 为 它 完全 指定 了 
int 的 表示 形式 。 这 样 做 的 优点 是 ， 对 于 旧 的 程序 ， 比 起 那些 依赖 硬件 细节 设 定 int 的 表示 方 
式 的 语言 ，Java 程序 在 新 的 计算 机 上 工作 的 可 能 性 更 高 。 缺 点 是 32 位 通常 还 不 够 。 例 如 ， 
2014 年 ，Google 不 得 不 改变 其 记录 视频 观看 次 数 的 32 位 变量 ， 因 为 歌曲 视频 《江南 style 》 
(Gangham Style) 被 观看 超过 2 147 483 647 次 。 在 Java 中 ， 你 可 以 切换 到 long。 

问 : 这 似乎 应 该 是 由 系统 处 理 的 事情 ， 对 吧 ? 

答 : 有 些 语言 ， 如 Python， 对 于 整数 的 大 小 不 做 限制 ， 当 需要 时 ,系统 可 以 使 用 多 个 
字 表 示 整 数值 。 在 Java 中 ， 你 可 以 使 用 BigInteger 类 。 

问 : 什么 是 BigInteger 类 ? 

答 : 它 允 许 你 使 用 整数 进行 计算 而 不 用 担心 溢出。 例如 ， 如 果 你 导入 java.math. 
BigInteger， 那 么 代码 


BigInteger x = new BigInteger("2"); 
StdOut.printin(x.pow(100)); 


输出 1267650600228229401496703205376， 即 2”。 你 可 以 将 BigInteger 视 为 一 个 字符 串 
(内 部 表示 比 这 个 更 有 效率 )。 该 类 提供 了 标准 算术 操作 及 其 他 操作 的 方法 。 例如， 该 方法 在 
加 密 时 很 有 用 ， 因 为 在 一 些 加 解密 系统 中 的 关键 操作 常常 需要 数 百 位 数字 的 算术 运算 。 在 库 
函数 的 实现 中 ， 必 要 时 会 使 用 多 个 数字 进行 连接 ， 所 以 溢出 不 是 一 个 问题 。 当 然 ， 其 操作 比 
内 置 的 long 或 int 操作 要 复杂 得 多 ,， 所 以 Java 程序 员 不 会 对 long 或 int 就 可 以 满足 支持 的 
整数 使 用 BigInteger。 

问 : 为 什么 是 十 六 进 制 ? 其 他 进 制 都 不 能 完成 这 项 工作 吗 ? 

答 : 基数 为 8， 或 入 进 制 ， 在 早期 12 位 、24 位 或 36 位 的 计算 机 中 广泛 使 用 ， 因 为 一 个 
字 的 内 容 可 以 用 4、8 或 12 位 八进制 数字 表示 。 在 这 样 的 系统 中 使 用 八进制 的 优点 是 只 需要 
使 用 十 进 制 数字 0 一 7， 所 以 简单 的 IO 设备 〈 如 数字 键盘 ) 十 进 制 和 八进制 都 可 以 使 用 。 但 
是 八进制 对 于 32 位 和 64 位 的 字 来 说 并 不 方便 ， 因 为 字 的 大 小 不 能 被 3 整除 (也 不 能 被 5 或 
6 整除 ， 所 以 换 用 更 大 的 基数 也 不 可 能 )。 

问 : 如 何 防 范 溢出 ? 

答 : 这 并 不 简单 ， 因 为 每 种 操作 都 需要 不 同 的 检查 。 例 如 ， 如 果 你 知道 x 和 y 都 为 正 ， 
想 要 计算 x+y， 可 以 检查 x<Integer.MAX VALUE-y。 

答 : 另 一 种 方法 是 “向 上 ”转换 为 一 种 范围 更 大 的 类 型 。 例 如 ， 如 果 你 正在 用 int 类 型 
计算 ， 则 可 以 将 其 转换 为 long 类 型 ， 然 后 将 结果 转换 回 int (如 果 结 果 不 是 很 大 的 话 )。 

答 : 在 Java 8 中 ， 可 以 使 用 Math.addExact()。 对 于 溢出 的 情况 ， 这 个 操作 可 以 抛 出 
异常 。 

问 : 对 于 二 进 制 补 码 ， 硬件 如 何 检 测 溢出 ? 

答 : 规则 很 简单 ， 虽 然 证 明 有 点 棘手 : 检查 最 左 位 的 进位 进项 及 前 导 位 的 进位 出 项 。 如 
果 它 们 不 同 ， 则 显示 溢出 (参见 下 图 )。 
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进位 进项 
与 进位 出 
项 不 同 
A 
i000000000000000 
和 于 OO -8 
1000000000000100 -32764 
1 -4X 
进位 进项 
与 进位 出 
项 不 同 
入 
O111111111111000 
0111111111111000 32760 


0000000000001000 + 8 
1000000000000000 -32768X 
898 溢出 ( 16 位 二 进 制 补 码 ) 
问 : 算术 移 位 的 目的 是 什么 ? a 
答 : 对 于 二 进 制 补 码 整数 ， 算 术 移 位 右 移 1 位 与 二 0000000000010000 16 
整数 除 2 的 结果 相同 。 例 如 ， 如 右 图 所 示 ，(-16)>>3， ISSN 
结果 为 -2。 为 了 检验 你 对 该 操作 的 理解 ， 计 算 X>>3: 0000000000000010 迷 
(-3)>>1 和 (-1)>>1 的 值 。 这 种 转换 被 称 为 “符号 扩 TK 


展 ” (sign extension)， 与 逻辑 移 位 的 “ 零 扩 展 ” 相 反 。 负数 
问 : 如 果 y 为 负 或 y 大 于 31， 则 x>>y 的 结果 是 站 NN 二 有 
什么 ? x>>3: MSNNSSNSSSS， 和 
答 : 对 于 移 位 操作 ，Java 只 使 用 第 二 个 操作 数 fi 
的 低 五 位 。 这 种 行为 与 典型 计算 机 上 的 物理 硬件 相 et 
合 。 算术 移 位 ( 16 位 二 进 制 补 码 ) 
问 : 我 没有 真正 理解 1.2 节 中 问答 环节 的 例子 ， 为 什么 (0.1+0.1==0.2) 为 真 ， 而 
(0.1+0.1+0.1===0.3 ) 为 假 。 可 以 详细 说 明 一 下 吗 ? 
答 : 在 Java 源码 中 , 像 0.1 或 0.3 的 常量 会 被 转换 为 最 接近 的 64 位 下 EE 754 数字 ( 当 
其 为 偶数 时 ， 最低 有 效 位 为 0)， 是 一 个 Java 的 double 值 。 下 面 是 0.1、0.2 和 0.3 的 常量 : 
常量 最 接近 的 64 位 IEEE 754 数 字 
0.1 0.1000000000000000055511151231257827021181583404541015625 
0.2 0.2000000000000000111022302462515654042363166809082031250 
WE 0.2999999999999999888977697537484345957636833190917968750 


如 你 所 见 , 0.1 + 0.1 等 于 0.2,， 但 0.1+0.1+0.1 比 0.3 大 。 这 种 情况 与 下 面 的 情形 类 似 ， 
899| 对 于 整数 ，2/5 + 2/5 等 于 4/5 (它们 都 是 0), 但 是 2/5 + 2/5 + 2/5 不 等 于 6/5。 
问 : System.out.println(0.1) 输出 0.1， 而 非 前 文 表格 中 的 值 。 为 什么 ? 
答 : 很 少 有 程序 员 需 要 这 么 高 的 精度 ， 所 以 println( 出 于 可 读 性 考虑 将 数值 截 短 。 其 实 
现 方式 是 将 打印 的 精度 控制 到 能 与 double 类 型 的 相 邻 值 区 分 开 来 ， 然 后 在 这 个 精度 的 基础 
上 再 多 显示 一 位 数字 。 你 可 以 使 用 printf() 更 精确 地 控制 显示 格式 ， 而 BigDecimal 则 可 用 于 
进一步 扩展 精度 。 例 如 ， 你 可 以 导入 java.math.BigDecimal， 那 么 代码 


double x = 0.1; 
Stdout.printlnCnew BigDecimal (x)); 


会 输出 0.1000000000000000055511151231257827021181583404541015625。 
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6.1.11 
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将 十 进 制 数字 92 转换 为 二 进 制 。 
答案 : 1011100。 
将 八进制 数字 31415 转换 为 二 进 制 。 
答案 : 011001100001101。 
将 八进制 数字 314159 转换 为 十 进 制 。 
答案 : 这 不 是 一 个 八进制 数字 ! 你 可 以 进行 计算 ， 甚 至 是 使 用 Convert， 得 到 结果 104561, 但 
是 9 不 是 一 个 合法 的 八进制 数字 。 在 本 书 网 站 上 的 Convert 版 本 包含 这 样 的 合法 习惯 检查 。 老 
师 在 考试 中 考查 这 一 点 并 不 罕见 ， 所 以 要 小 心 ! 
将 十 六 进 制 数字 BB23A 转换 为 八进制 。 
答案 : 首先 转换 为 二 进 制 1011 1011 0010 0011 1010， 然 后 一 次 考虑 3 位: 10 111 011 001 000 
111 010， 可 以 将 其 转换 为 八进制 2731072。 
将 两 个 十 六 进 制 数字 23AC 和 4B80 相 加 ， 并 将 结果 用 十 六 进 制 表示 。 提 示 : 直接 使 用 十 六 进 
制 相 加 ， 而 非 转换 为 十 进 制 ， 相 加 ， 再 转换 回来 。 
假设 m 和 nn 均 为 正 整 数 。 在 2"'" 的 二 进 制 表示 中 有 多 少 位 为 1? 
哪个 十 进 制 整数 的 十 六 进 制 表示 正好 是 它 本 身 反 过 来 ? 
答案 : 53 的 十 六 进 制 是 35。 
证 明 : 一 次 将 十 六 进 制 数字 的 一 位 转换 为 二 进 制 ， 得 到 的 总 是 正确 结果 ， 反 之 亦 然 。 
IPv4 是 20 世纪 70 年 代 提 出 的 协议 ， 其 规定 了 互联 网 上 的 计算 机 如 何 进行 通信 。 互 联网 上 的 每 
台 计 算 机 都 需要 自己 的 Internet 地 址 。IPv4 使 用 32 位 地 址 。 互 联网 可 以 容纳 多 少 台 计 算 机 ? 是 
否 足 够 让 每 个 手机 和 每 台 烤 面包 机 都 有 自己 的 地 址 ? 
在 IPv6 协议 中 每 台 计 算 机 都 有 一 个 128 位 的 地 址 。 如 果 该 标准 被 采用 ， 互 联网 上 可 以 容纳 多 
少 台 计算 机 ? 是 否 足 够 ? 
答案 : 2”。 至 少 短期 内 足够 一 一 地 球 表面 每 平方 微米 可 以 分 到 5000 个 地 址 。 
在 表 中 填写 各 表示 所 代表 的 值 : 


表示 0x3 & 0x5 0x3 | 0x5 0x3 人 0x5 0x1234 << 8 
,| 


实现 正文 中 指定 的 toInt0 方法 ， 用 于 将 0 一 9 或 A 一 Z 范围 内 的 字符 转换 为 0 一 35 之 间 的 值 。 
答案 : 


public static int toInt(char c) 


if (CC >= '0') && (c <= !9')) returnc- '0'; 
return C - 'A' + 10; 


} 

实现 正文 中 指定 的 toChar0 方法 ， 用 于 将 0 一 35 之 间 的 值 转换 为 0 一 9 或 A 一 Z 范围 内 的 字符 。 
答案 : 

public static char toCharCint i) 


fi 10) return Cchar}y C0" + 1)» 
return (char) ('A' + i - 10); 
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6.1.14 


6.1.15 


6.1.16 


6.1.17 
6.1.18 


6.1.19 


6.1.20 
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修改 Convert (以 及 前 两 个 练习 的 答案 )， 使 其 可 以 使 用 long 型 ， 检 测 溢出 并 检查 输入 字符 串 
中 的 数字 是 否 在 基数 指定 的 范围 内 。 

答案 : 见 本 书 网 站 上 的 Convert.java。 

将 某 版 本 的 toString() 方法 添加 到 Convert 中 ， 该 toString() 方法 的 第 三 个 参数 指定 了 生成 的 字 
符 串 的 长 度 。 如 果 指 定 的 长 度 小 于 转换 出 的 位 数 ， 则 只 返回 最 右 端的 数字 ; 如 果 指 定 长 度 更 
大 ， 则 前 端 用 0 补足 。 例 如 ，toString(64206,16,3) 应 返回 “ACE”，toString(15,16,4) 应 返回 
“000F”。 提 示 : 先 调用 两 个 参数 的 版 本 。 

构建 一 个 Java 程序 TwosComplement， 从 命令 行 中 获取 一 个 int 型 值 i 和 字 长 w， 输 出 i 的 w 
位 二 进 制 补 码 表示 及 这 个 数字 的 十 六 进 制 表示 。 假 设 w 是 4 的 倍数 。 例 如 ， 你 的 程序 应 该 有 
如 下 表现 : 


% java TwosComplement -1 16 
1111111111111111 FFFF 


% java TwosComplement 45 8 
00101101 2D 


% java TwosComplement -1024 32 
11111111111111111111110000000000 FFFFFC00 


将 ExtractFloat 修改 为 程序 ExtractDouble， 使 其 能 够 对 double 类 型 值 实现 相同 的 操作 。 

编写 一 个 Java 程 序 EncodeDouble， 从 命令 行 获取 一 个 double 类 型 值 根据 IEEE 754 
binary32 标准 编码 为 一 个 浮 点 数 。 

请 填写 表 中 的 空白 处 。 


二 进 制 浮 点 数 


0010001000110100 
1000000000000000 





请 填写 表 中 的 空白 处 。 
二 进 制 十 六 进 制 无 符号 数 二 进 制 补 码 ASCII 字符 


1001000110100111 
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IP 地 址 和 了 PT 值 。 一 个 IP 地 址 (IPv4) 由 整数 w、x、y、z 组 成 ,通常 被 写成 字符 串 w.x.y.z。 
对 应 的 全 值 为 16777216w + 65536x + 256y + z。 给 定 一 个 IP 了 数字 n， 通过 w= (n/1677216) 
mod 256、x=(n/65536) mod 256、y= (n/256) mod 256、z=n mod 256 可 以 得 到 其 对 应 的 IP 地 址 。 
编写 一 个 函数 ， 输 入 一 个 了 王 值 ， 返 回 表 示 IP 地 址 的 字符 串 ， 编 写 男 一 个 函数 ,输入 IP 地 址 ， 
返回 对 应 IP 值 的 int 值 。 例如， 给 定 3401190660， 第 一 个 函数 应 该 返回 202.186.13.4。 
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6.1.22 ”IP 地址。 编写 一 个 程序 ， 从 命令 行 中 获取 一 个 32 位 字符 串 ， 并 以 点 分 十 进 制 的 形式 ( dotted 
decimal form) 输出 其 对 应 的 IP 地 址 。 也 就 是 说 ， 一 次 获取 8 位 ,将 每 一 组 转换 为 十 进 制 ， 并 
将 每 组 以 点 分 隔 开 。 例 如 ， 二 进 制 耻 地址 01010000000100000000000000000001 应 被 转换 为 
80.16.0.1。 

6.1.23 MAC 地 址 。 编 写 一 个 函数 ， 实 现 MAC 地 址 与 48 位 long 型 整数 的 相互 转换 。 

6.1.24 Base64 编码 。Base64 编码 是 通过 互联 网 发 送 二 进 制 数据 的 常用 方法 。 它 将 任意 数据 转换 为 
ASCII 文 本 ,使 其 可 以 在 系统 之 间 通 过 电子 邮件 发 送 ， 而 不 会 出 现任 何 问 题 。 编 写 一 个 程序 来 
读 取 一 个 任意 的 二 进 制 文件 ， 并 使 用 Base64 进行 编码 。 

6.1.25 浮 点 数 软件 。 编 写 一 个 FloatingPoint 类 ， 它 共有 三 个 实例 变量 sign、exponent 和 fraction。 实 
现 加 法 和 乘法 ， 以 及 toString0 和 parseFloat()， 支 持 16 位 、32 位 和 64 位 格式 。 

6.1.26 ”DNA 编码 。 编 写 一 个 DNA 类 ， 支 持 仅 由 A、T、C 或 G 字 符 组 成 的 字符 串 的 高 效 表 示 。 其 包 
含 一 个 将 字符 串 转 换 为 内 部 表示 形式 的 构造 函数 、 将 内 部 表示 形式 转换 为 字符 串 的 toString() 
方法 、 返 回 指定 索引 处 字符 的 charAt( 方法 ， 以 及 将 String pattern 作为 参数 并 返回 pattern 在 
表示 字符 串 中 第 一 次 出 现 的 indexOf() 方法 。 对 于 内 部 表示 ， 请 使 用 int 型 数组 ， 每 个 int 中 包 
含 16 个 字符 (每 个 字符 占 两 位 )。 


6.2 TOY 计算 机 


为 了 帮助 你 更 好 地 理解 计算 机 上 计算 的 本 质 ， 我们 在 本 节 中 介绍 TOY， 这 是 一 个 为 本 
书 设计 的 假想 计算 机 ， 与 20 世纪 70 年 代 首 次 广泛 使 用 的 计算 机 非常 相似 。 我 们 今天 研究 
它 ， 因 为 它 也 具有 现代 微 处 理 器 所 具有 的 基本 特征 ， 如 移动 设备 的 处 理 器 、 计 算 机 中 的 处 理 
器 以 及 其 他 任何 地 方 出 现 的 处 理 器 ， 甚 至 包括 在 这 些 年 间 开 发 的 无 数 其 他 计算 设备 。 下 图 展 
示 了 PDP-8 一 一 一 台 20 世纪 70 年代 的 真实 计算 机 ， 以 及 我 们 的 假想 计算 机 TOY。 


PDP-8，20 世 纪 70 年 代 TOY， 假想 计算 机 









Rh 
真实 的 计算 机 与 假想 机 

TOY 演示 了 简单 计算 模型 如 何 执行 那些 关键 的 计算 任务 ， 也 可 以 帮助 你 了 解 计算 机 的 
基本 特征 。 在 过 去 的 几 十 年 中 ， 计 算 演 变 的 一 个 显著 事实 是 ， 所 有 的 计算 机 都 具有 相同 的 基 
本 结构 ， 这 种 方法 在 约翰 冯 … 诺 依 曼 1945 年 首次 阐述 之 后 几乎 立即 被 广泛 采用 。 

我 们 首先 介绍 TOY 计算 机 的 基本 组 成 部 分 。TOY 其 实 仅 有 几 个 部 分 ， 且 每 部 分 的 目的 
都 很 容易 理解 。 所 有 的 计算 机 都 由 相似 的 部 分 构成 。 

接 下 来 我 们 描述 TOY 计算 机 的 使 用 和 编程 方法 。 我 们 从 上 一 节 中 介绍 的 信息 表示 的 基 
本 方法 开始 ， 先 来 看 对 这 类 信息 的 操作 。 换 名 话说， 我 们 正在 使 用 TOY 计算 机 硬件 实现 对 
数据 类 型 ( 即 值 的 集合 以 及 对 这 些 值 的 操作 ) 的 支持 。 在 这 个 层面 上 的 工作 被 称 为 机 器 语言 
编程 。 学 习 在 机 器 语言 层面 上 编程 会 帮助 你 更 好 地 理解 Java 程序 与 计算 机 之 间 的 关系 ， 以 
及 计算 本 身 的 性 质 。 机 器 语言 编程 实际 上 在 诸如 视频 处 理 、 音 频 处 理 和 科学 计算 等 性 能 关键 
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类 的 应 用 中 仍然 使 用 。 你 将 会 看 到 ， 学 习 如 何 用 机 器 语言 编程 并 不 困难 。 

第 7 章 将 介绍 如 何 用 硬件 构建 这 样 的 机 器 。 这 是 揭 开 计算 机 神秘 面纱 的 最 后 一 步 ， 能 够 
帮助 你 更 好 地 理解 Java 程序 与 物理 世界 之 间 的 联系 。 

在 所 有 计算 机 中 都 能 找到 一 个 重要 的 抽象 屋 ， 即 机 器 语言 。 它 能 够 对 处 理 器 执行 的 操作 
进行 准确 描述 ， 像 Java 这 样 的 高 级 语言 编写 的 程序 最 终 会 被 翻译 成 这 样 的 语言 来 执行 ， 同 
时 ， 它 也 提供 了 构建 和 实现 该 机 器 的 电路 蓝图 。 

简要 的 历史 回顾 “想象 一 个 没有 计算 机 的 现代 世界 可 能 有 点 儿 困 难 。 我 们 选择 一 个 时 间 点 ， 
如 20 世纪 50 年 代 ， 当 时 经 历 二 战 后 的 世界 正 逐 步 走向 工业 化 ， 并 研制 出 了 汽车 、 飞 机 、 卫 星 
等 各 种 现在 仍 广泛 使 用 的 技术 ,但 普通 人 其 至 一 般 的 科学 家 或 工程 师 都 没有 计算 机 可 以 利用 。 

构建 计算 机 的 最 初 动机 是 为 了 执行 科学 、 工 程 和 商业 等 各 种 领域 中 的 计算 。“ 二 战 ”本 
身 就 证 明了 这 一 点 ， 从 约翰 汉 : 诺 依 曼 计 算 的 弹道 表 到 艾 伦 * 图 灵 开 发 的 密码 机 ( 恩 尼 格 
玛 密码 机 一 一 译 者 注 )， 更 不 用 说 在 洛斯 阿拉 莫 斯 (Los Alamos) 完成 的 推动 原子 弹 发 展 的 计 
算 。 想 象 一 下 ， 在 没有 计算 机 的 情况 下 如 何 经 营 一 家 银行 或 制造 一 辆 汽车 。 

在 20 世纪 70 年 代 之 前 一 个 典型 的 科学 或 工程 学 生 用 于 
计算 的 最 重要 的 工具 是 算 尺 (slide rule， 见 右 图 )， 这 是 一 种 
绝对 非 电子 、 非 数字 化 的 设备 ,但 非常 有 用 ， 特 别 是 对 于 计 
算 对 数 和 乘法 运算 。 另 一 个 常用 工具 是 一 本 《函数 表 》(tables 
of functions)， 例 如 ， 要 计算 sin(x)， 就 要 在 书 中 查找 1 

起 初 人 们 开始 使 用 计算 机 时 ,通常 是 由 一 组 人 一 起 使 
用 ,并 且 使 用 起 来 非常 麻烦 。 尽 管 如 此 ， 相 对 于 算 尺 和 函数 
表 来 说 计算 机 是 一 个 巨大 的 改进 。 在 很 短 的 时 间 内 ， 人 们 共享 大 型 计算 机 的 方式 使 得 算 尺 和 
函数 表 成 为 过 去 式 。 多 年 来 ， 人 们 也 使 用 与 计算 机 拥有 相同 技术 的 计算 器 ， 但 计算 器 只 是 用 
于 计算 ， 并 且 是 手持 式 的 。 当 然 ， 对 于 简单 的 计算 ， 人 们 使 用 计算 器 仍然 能 够 实现 。 

就 像 现 在 一 样 ， 对 于 复杂 的 计算 ， 科 学 家 工程 师 和 应 用 程序 开发 大 员 通 过 编写 计算 机 
程序 来 解决 问题 。 以 此 为 目的 创造 出 的 第 一 批 设备 的 基本 设计 至 今 仍 然 改 变 着 世界 ， 这 是 非 
常 了 不 起 的 。 

TOY 计算 机 的 组 件 ”我 们 首先 对 半 个 世纪 以 来 几乎 在 所 有 计算 机 中 使 用 的 基本 设计 组 
件 进行 一 个 概述 ,但 是 只 简要 说 明 我 们 的 TOY 计算 机 会 涉及 的 必要 零件 。 

内 存 。 对 任何 计算 机 来 说 ， 内 存 (memory) 都 是 重要 的 组 成 部 分 。 它 不 仅 存 储 着 要 处 
理 的 数据 和 计算 结果 ， 还 存储 着 机 器 运行 的 程序 。TOY 的 内 存 由 256 个 字 组 成 ， 每 个 16 位 。 
按照 今天 的 标准 ， 这 当然 不 算 什 么 ， 但 你 会 对 它 能 支持 的 计算 范围 感到 惊讶 。 这 是 一 个 发 人 
深 省 的 思考 ; 256x16 = 4096 位 ， 有 2” 个 不 同 的 可 能 值 ， 所 以 TOY 可 以 做 的 绝 大 多 数 事 
情 将 永远 不 会 在 这 个 世界 上 发 生 。 

车 用 十 六 进 制 表示 法 ， 我们 可 以 用 4 个 十 六 进 制 数字 来 指定 一 个 内 存 字 的 内 容 。 此 外 ， 
我 们 考虑 将 字 从 0 到 255 进行 编号 ， 以 便 可 以 将 每 个 字 用 两 位 十 六 进 制 数 表示 ， 这 个 编号 称 
为 地 址 。 例 如 ， 我 们 可 以 说 “地 址 IE 上 存储 的 字 的 值 是 OFA2” 或 者 “存储 单元 1E 的 值 是 
0FA2”。 为 了 表述 方便 ， 我 们 经 常 使 用 数组 符号 ， 也 就 是 “M [1E] 是 0FA2”。 我 们 可 以 使 
用 像 上 述 那 样 的 16 行 表 来 指定 TOY 内 存 的 内 容 。 第 一 列 给 出 位 置 00 到 0F 的 值 ; 第 二 列 给 
出 位 置 10 到 1F 的 值 ， 等 等 。 这 样 的 表 被 称 为 内 存 导 出 (memory dump)。 与 此 同时 ， 内 存 
还 必须 能 够 存储 我 们 在 本 章 中 设计 的 所 有 程序 ! 
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7A10 8A15 8A2B 7101 7101 7800 8AFF 7101 7101 BBOE 0000 0000 0000 0000 0000 0000 
7BEF 8B16 8B2C 75FF 7A00 8CFF 8BFF A90A A90A 1lEE1 0000 0000 0000 0000 0000 0000 
9AFF 1CAB 2CAB 7901 7B01 CC55 7101 140A 180A 900E 0000 0000 0000 0000 0000 0000 
9BFF 9C17 CC29 2C59 894C 188C 7900 7B00 C98F 1EEI 0000 0000 0000 0000 0000 0000 
7101 0000 DC27 CC3B C94B C051 22B9 C97C AC09 900E 0000 0000 0000 0000 0000 0000 
7900 0008 2BBA 1991 9AFF 98FF C26B 2991 2CBC 1EE1 0000 0000 0000 0000 0000 0000 
22B9 0005 C022 1A09 1CAB 0000 1CA9 2441 CC96 EF00 0000 0000 0000 0000 0000 0000 
C200 0000 EF00 8B3D 1ABO 0000 8DFF AC04 1991 0000 0000 0000 0000 0000 0000 0000 
1CA9 0000 0000 FF22 1BCO 0000 BDOC 2EBC 1809 0000 0000 0000 0000 0000 0000 0000 
ADOC 0000 00C3 2AA1 2991 0000 1991 DE7B A909 0000 0000 0000 0000 0000 0000 0000 
9DFF 0000 0111 CA36 C044 0000 C064 1B0C DCBE 0000 0000 0000 0000 0000 0000 0000 
1441 0000 0000 9B3E 0000 0000 1AA9 C074 1981 0000 0000 0000 0000 0000 0000 0000 
C006 0000 0000 0000 O000C FF60 BBOA EF00 1809 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 005B 0000 FF70 EF00 0000 A909 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 9BFF 0000 0000 C083 0000 0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 0000 0000 BE08 0000 0000 0000 0000 0000 0000 0000 


TOY 计算 机 的 内 存 导出 内 容 ( 256 个 16 位 的 字 ) 


指令 。TOY 计算 机 (以 及 几乎 所 有 其 他 计算 机 ) 的 一 个 关键 特征 是 ， 内 存 字 的 内 容 可 以 
解释 为 数据 ， 也 可 以 解释 为 指令 ， 这 取决 于 上 下 文 。 例 如 ， 从 上 一 节 知 道 ， 值 1234 可 能 被 
解释 为 表示 整数 46601 或 实数 0.00302886962890625。 在 本 节 中 ， 你 将 会 了 解 到 ， 它 也 可 能 
代表 将 两 个 数字 相 加 的 机 器 指令 。 程 序 员 要 确保 数据 被 视 为 数据 ， 并 将 指令 视 为 指令 。 我 们 
将 分 析 所 有 的 TOY 指令 是 如 何 编码 的 ， 以 便 知 道 如 何 将 任何 一 个 16 位 值 解码 为 指令 (以 及 
如 何 将 任何 一 个 指令 编码 为 16 位 值 )。 

寄存 器 。 寄 存 器 是 保存 一 系列 位 的 机 器 组 件 ， 更 像 是 内 存 中 的 字 。 寄 存 8[01 0000 
器 用 于 在 计算 过 程 中 保存 中 间 结果 。 你 可 以 认为 它们 在 TOY 编程 中 扮演 变 。 12】 000X 
量 的 角色 。TOY 有 16 个 寄存 器 ， 从 0 到 下 编号 。 与 存储 器 一 样 我 们 使 用 数 ” R[3] ”0000 
组 符号 为 其 命名 ， 即 从 R[0] 到 R[F] 的 寄存 器 。 由 于 它们 是 16 位 的 , 与 内 RI4] 0000 
存 字 相同 ， 所 以 我 们 用 4 位 十 六 进 制 值 表示 每 个 寄存 器 的 内 容 ， 并 用 16 个 4 5】 9909 
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位 十 六 进 制 数 来 表示 所 有 寄存 器 的 内 容 。 右 边 的 表格 展示 了 典型 计算 过 程 中 。 i; 0000 
寄存 器 的 内 容 ， 我 们 将 在 后 面 讨 论 。 按 照 惯例 ，R[0] 总 是 0000。 R[8] “003A 

算术 远 辑 单元 。 算 术 遇 辑 单元 (Arithmetic Logic Unit ALU) 是 TOY 的 ”8[3] 0000 
计算 引擎 一 机 器 执行 所 有 计算 的 主力 。 通 常 ， 一 条 TOY 指令 指示 ALU 计 。 Rb 0844 


算 某 个 函数 ， 它 将 两 个 寄存 器 作为 参数 ， 并 将 结果 存 人 第 三 个 寄存 器 。 例 “Rrc] oc78 
如 ，TOY 指令 1234 表示 将 R[2] 和 R[3] 的 内 容 送 入 ALU， 将 它们 相 加 , 然 ”R[D] 0000 
后 将 结果 写 人 R[4]。 在 本 节 的 后 面 ， 我 们 将 介绍 如 何 根据 这 些 指令 来 编写 Ar 0000 
TOY 程序 。 

程序 计数 器 和 指令 寄存 器 -程序 计数 器 -(PioBEaniCiUteE 了 PC) 是 一 个 8 TOY 的 琳 丰 吉 
位 的 内 部 寄存 器 ， 用 于 保存 下 一 条 要 执行 的 指令 的 地 址 。 指 令 寄存 器 ( Instruction Register, 
IR) 是 一 个 保存 正在 执行 的 当前 指令 的 16 位 内 部 寄存 器 。 这 些 寄存 器 是 机 器 操作 的 核心 。 
虽然 IR 不 直接 被 程序 访问 ， 但 是 程序 员 总 能 知道 它 的 内 容 。 

下 图 包含 了 这 些 基 本 的 组 件 z 在 第 7 章 中 ,我 们 将 考虑 如 何 创 建 一 个 电路 〈circuit) 以 
实现 它们 的 功能 。 在 本 章 的 其 他 部 分 ,我们 将 探讨 它们 是 如 何 操作 的 ， 以 及 程序 员 如 何 控制 
它们 以 执行 期 望 的 计算 。 
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TOY 计算 机 的 组 件 


读 取 ~ 递增 - 执行 周期 “TOY 计算 机 通过 重复 执行 特定 的 动作 序列 来 执行 指令 。 首 先 
检查 PC 的 值 ， 并 将 该 存储 位 置 的 内 容 提 取 (复制 ) 到 IR 中 。 接 下 来 ， 它 将 程序 计数 器 递增 
1 (例如 ， 如 果 程 序 计数 器 当前 为 10， 则 递增 到 11 )。 最 后 ， 它 将 

IR 中 的 16 位 值 解释 为 指令 ， 并 按照 TOY 计算 机 的 规则 执行 (该 规 AAA 
则 我 们 稍 后 描述 ) 。 每 条 指令 都 可 以 修改 各 种 寄存 器 、 主 存储 器 甚 。 读 取 | 
至 程序 计数 器 本 身 的 内 容 。 执 行 该 指令 后 ， 机 器 重复 整个 读 取 - 北 

增 - 执行 周期 ， 使 用 新 的 程序 计数 器 的 值 找到 下 -一 条 指令 。 这 个 过 

程 一 直 持续 下 去 ， 或 者 直到 机 器 执行 停机 指令 。 与 Java 一 样 ， 我 


们 可 以 编写 出 无 限 循环 的 程序 。 为 了 使 TOY 计算 机 在 无 限 循环 中 入 执行 
停止 ， 程 序 员 必 须 将 其 关闭 ， 甚 至 拔 掉 它 的 电源 。 读 取 - 递增 - 执行 周期 


指令 任何 16 位 值 (任何 内 存 字 的 内 容 ) 都 可 以 解释 为 一 条 TOY 指令， 每 条 指令 的 目 
的 是 以 某 种 方式 修改 机 器 的 状态 (内存 字 、 寄 存 器 或 PC 的 值 )。 为 了 描述 指令 的 操作 ， 我 们 
使 用 伪 代 码 (pseudo-code)， 除 了 直接 操作 内 存 字 、 寄 存 器 和 PC 以 外 ， 它 与 Java 代码 非常 
类 似 。 

一 条 指令 的 剖析 。 我 们 使 用 十 六 进 制 编 码 表示 指令 : 每 个 16 位 指令 是 4 个 十 六 进 制 数 
字 。 指 令 的 第 一 位 是 它 的 操作 码 (opcode)， 指 定 所 执行 的 操作 。 共 有 16 个 不 同 的 指令 ,每 
一 个 都 由 一 个 十 六 进 制 数字 表示 。 指 令 的 第 二 位 数字 指定 一 个 寄存 器 (register) 每 条 
指令 都 使 用 或 更 改 某 个 寄存 器 的 值 。 共 有 16 个 寄存 器 ， 同 样 地 每 一 个 都 由 一 个 十 六 进 制 
数字 表示 。 大 部 分 指令 的 第 三 位 和 第 四 位 十 六 进 制 数字 都 以 以 下 两 种 指令 格式 〈instruction 
format) 编码 : 在 RR 格式 的 指令 中 ， 剩 下 的 两 个 十 六 进 制 数字 中 的 每 一 个 都 是 指 一 个 寄存 
器 。 在 A 格式 的 指令 中 ,第 三 个 和 第 四 个 十 六 进 制 数字 (一 起 ) 指定 一 个 内 存 地 址 。 


RR 格式 
这 尺 司 奏 可 乱 史 芍 项 本 条 度 高 达 演 可 





字 节 码 (4 位 ) 


寄存 器 (4 
A 格式 | 了 


地 址 (8 位 ) 
TOY 指令 剖析 
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旨 令 集 。 下 面 的 表格 描述 了 TOY 的 所 有 指令 。 这 个 表 是 TOY 编程 的 完整 参考 指南 ， 
在 编写 TOY 程序 时 请 参考 。 接 下 来 ,我 们 将 详细 介绍 这 些 指 令 。 


操作 码 描述 格式 伪 代 码 
0 停机 一 
1 加 RR R[d] <- R[s] + R[t] 
2 减 RR R[d] <- R[s] - R[t] 
3 按 位 与 RR R[d] <- R[s] & RI[t] 
4 按 位 异 或 RR R[d] <- R[s] A RI[t] 
5 左 移 RR R[d] <- R[s] << R[t] 
6 右 移 RR R[d] <- R[s] >> R[t] 
7 加 载 地 址 A R[d] <- addr 
8 加 载 A R[d] <- M[addr] 
9 存储 A M[addr] <- R[d] 
A 间接 加 载 RR R[d] <- M[R[Lt]] 
B 间接 存储 RR M[R[t]] <- R[d] 
C 等 于 零 则 跳 转 A if (R[d] == 0) PC <- addr 
D 正 数 则 跳 转 A if (R[d] > 0) PC <- addr 
E “ 跳 转 到 寄存 器 指令 的 地 址 ”- PC <- R[d] 
F 链接 并 跳 转 A  R[d] <- PC; PC <- addr 


TOY 指令 集 


停机 。 操 作 码 0 是 最 基本 的 指令 ， 它 简单 地 指示 机 器 停机 ， 即 停止 读 取 - 递增 - 执行 
周期 。 此 时 ， 程 序 员 可 以 检查 内 存 的 内 容 来 查看 计算 结果 。TOY 忽略 停止 操作 指令 的 另外 3 
个 十 六 进 制 数字 ， 所 以 0000、0123 和 OFFF 都 是 暂停 指令 。 

算术 指令 。 操作 码 1 和 2 是 算术 (arithmetic) 指令 ， 它 调用 ALU 对 两 个 寄存 器 (R[s] 和 
R[t) 进行 算术 运算 ,并 将 结果 存 和 第 三 个 寄存 器 (R[d])。 例 如 ， 指 令 1234 的 意思 是 “将 R[3] 
加 到 R[4] 并 把 结果 放 在 RI2] 中 ”,2AAC 意思 是 “从 R[A] 中 减 去 RIC] 并 把 结果 放 在 RIA] 中 ”。 
这 些 指 令 可 以 说 是 实现 了 TOY 的 整 型 数据 类 型 : 值 的 集合 是 16 位 整数 ， 操 作 是 加 和 减 。 

内 存 地 址 指令 。 操 作 码 7、A 和 B 是 内 存 地 址 (memory address) 指令 ,我 们 用 它们 来 
操纵 TOY 中 的 地 址 。 例如， 指令 7423 的 意思 是 “将 R[4] 设置 为 值 0023” 或 者 R[4] = 0023 
(注意 前 导 0 )。 然 后 操作 码 A 和 B 可 以 通过 寄存 器 中 的 地 址 间接 访问 存储 器 。 理 解 这 些 指令 
能 够 让 你 更 有 效 地 理解 Java 中 变量 访问 的 原理 。 我 们 在 稍 后 讨论 实现 数组 和 链接 结构 时 将 
更 详细 地 讨论 它们 的 用 法 。 

操作 码 7 的 另 一 个 重要 用 途 是 作为 一 个 整 型 数据 类 型 的 指令 : 一 旦 这 些 位 被 加 载 到 寄存 
器 中 ,我 们 可 以 在 算术 指令 中 使 用 它们 (将 它们 当 作 一 个 整数 来 处 理 )。 例 如 ,我 们 使 用 指 
令 7C01 将 R[C] 设置 为 0001 (R[C] = 0001 )。 

逻辑 指令 。 操 作 码 3 一 6 是 逻辑 (logical) 指令 ， 它 们 调用 ALU 对 寄存 器 中 的 位 执行 操 
作 ， 就 像 我 们 在 5.1 节 中 提 到 的 Java 操作 一 样 。 操 作 码 3 是 “ 按 位 与 ”， 如 果 R[s] 和 Rb 中 
的 相应 位 都 是 1， 则 R[d] 中 的 每 位 被 设置 为 1 ; 否则 ， 它 被 设置 为 0。 类 似 地 ， 操 作 码 4 是 
“ 按 位 异 或 >， 如 果 Rr[s] 和 了 R[ 中 的 相应 位 不 同 ， 则 R[d] 中 的 每 位 被 设置 为 1 ; 操作 码 5 是 
将 R[s] 中 的 位 向 左 移 R[4] 位 ， 并 将 结果 保存 在 RId] 中 ， 丢 弃 移出 的 位 并 按 需 要 移 和 人 0 位 。 
操作 码 6 与 之 相似 ， 但 是 向 右 移 位 ， 并 且 移 入 的 位 与 符号 位 匹配 (参见 6.1 节 中 的 问答 环 
节 )。 我 们 参照 Java 中 对 整数 类 型 的 设计 ， 在 逻辑 指令 中 以 相应 的 方式 完成 TOY 的 整 型 数 
据 类 型 的 实现 。 在 TOY 中 ， 与 Java 一样 ， 我 们 有 时 会 忽略 数据 抽象 规则 ， 将 数据 视 为 16 
位 序列 ， 而 不 是 当 作 一 个 整数 。 就 像 在 Java 代码 中 一 样 ， 移 位 和 按 位 逻辑 指令 在 实现 和 解 
码 所 有 类 型 的 数据 时 都 非常 有 用 。 
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内 存 指 令 。 操 作 码 8 和 9 是 内 存 (memory) 指令 ， 用 于 在 内 存 和 寄存 器 之 间 传 输 数据 。 


例如 ， 指 令 8234 意思 是 “将 内 存 字 MI[34] 加载 到 寄存 器 R[2] 


按 位 与 
中 ”, 或 R[2] = M[34]。 而 指令 9234 意味 着 “将 R[2] 的 值 存储 到 0101000111010111 
岂 丰 字 MB 要 中 ”或 MER on 
控制 流 指令 。 操 作 码 C 一 F 是 控制 流 指令 (flow of control 
instruction)， 控 制 流 指令 可 以 修改 PC， 对 于 实现 流 控制 结 0101000111010111 
构 (编程 中 的 基本 操作 如 条 件 、 循 环 和 函数 等 ) 来 说 是 必 不 可 ^ 0011000101101110 
少 的 。 例 如 ， 指 令 C212 的 意思 是 “如 果 R[2] 为 0， 则 将 PC “090392323007 
为 12”。 特 别 要 注意 的 是 ， 由 于 RI[0] 始终 为 零 ， 因 此 COxx << 0000000000000110 
的 意思 是 “将 PC 设置 为 xx”。 这 个 操作 被 称 为 无 条 件 分 支 0 省 二 9430311000000 
(unconditional branch)。 改 变 PC 的 值 会 达到 改变 控制 流 的 效 “ 同 J 和 做 二 二 调 
当 我 们 研究 如 何 实现 函数 时 ， 将 会 更 详细 地 分 析 操 作 码 EE 和 下 。 0001000000111010 
这 当然 是 对 的 ,但 是 本 章 的 目标 之 一 就 是 要 说 服 你 , 像 这 样 的 >> 0000000000000011 
一 小 组 指令 可 以 编写 相当 于 你 在 本 书 前 部 分 学 到 的 所 有 Java 程 ea £0 FO 


序 甚至 所 有 程序 。 目 前 ， 要 记 住 的 最 重要 的 事情 就 是 ， 现 在 我 


们 已 经 知道 了 如 何 将 任何 16 位 值 解码 为 TOY 指令 。 

你 的 第 一 个 TOY 程序 ”程序 6.2.1 是 我 们 写 的 第 一 个 TOY 程序 ， 它 实现 了 两 个 整数 相 
加 ， 它 就 是 你 在 TOY 上 的 “Hello，World”。 与 HelloWorld.java 一 样 ， 在 1.1 节 中 ,我们 
从 一 个 简单 的 程序 开始 ， 让 我 们 专注 于 运行 程序 的 细节 。 程 序 6.2.1 中 的 代码 ( 称 为 机 器 代 
码 ) 展示 了 我 们 用 于 TOY 程序 的 各 种 约定 : 

。 包含 与 给 定 程 序 相关 的 所 有 数据 和 代码 。 

。 每 行 给 出 一 个 2 位 (十 六 进 制 ) 内 存 地 址 和 该 地 址 的 4 位 (十 六 进 制 ) 值 。 

。 PC 的 起 始 值 始终 是 第 一 条 指令 的 地 址 ， 用 粗 体 突出 显示 。 

。 第 三 列 给 出 每 个 指令 的 伪 代 码 。 

程序 本 身 就 是 存储 在 存储 单元 10 一 14 中 的 5 个 4 位 十 六 进 制 数字 。 伪 代码 使 得 这 个 程 
序 很 容易 理解 一 一 它 读 起 来 更 像 Java 程序 。 

为 了 跟踪 一 个 TOY 程序 ,我 们 简单 地 写 下 执行 的 每 个 指令 的 PC 和 IR 值 ， 以 及 任何 受 
影响 的 寄存 器 或 执行 后 的 内 存 字 。 代 码 下 面 的 表格 为 程序 6.2.1 提供 了 这 样 一 个 跟踪 。 为 了 
找到 计算 结果 ， 我 们 列 出 了 到 达 停 机 指令 时 的 内 存 内 容 、 停 机 指令 本 身 ， 任 何 有 变化 的 内 存 
位 置 的 值 已 经 以 粗 体 突出 显示 。 在 这 个 例子 中 ， 只 有 一 个 存储 器 值 发 生变 化 : 位 置 17 中 存 
储 着 计算 结果 000D。 

这 个 过 程 看 起 来 非常 简单 ， 但 是 我 们 还 没有 描述 真正 让 程序 运行 的 过 程 。 对 于 Java， 
我 们 可 以 描述 如 何 使 用 编辑 器 创建 程序 的 文件 ， 然 后 使 用 编译 器 和 Java 虚拟 机 执行 它 ， 并 
在 终端 窗口 中 查看 结果 。 对 于 TOY 来 说 ， 你 不 得 不 考虑 没有 操作 系统 、 没 有 应 用 程序 ， 当 
然 也 没有 编辑 器 、 终 端 仿真 器 、 编 译 器 ， 甚 而 运行 时 都 没有 键盘 或 者 显示 器 的 情况 。 

实际 上 ， 程 序 6.2.1 底部 的 图 片 展示 了 运行 程序 6.2.1 的 “结果 ”: 计算 机 前 面板 底部 的 
指示 灯 显 示 计 算 结 果 000D， 二 进 制 中 表示 为 0000000000001101。 接 下 来 ,我 们 逐步 分 析 程 

序 在 TOY 计算 机 上 运行 的 过 程 ， 并 实现 这 个 结果 。 
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程序 6.2.1 你 的 第 一 个 TOY 程 序 














20: 8A15 RI[A] <- M[15] Toad first summand into a 
11: 8B16 RI[B] <- M[16] load second summand into b 
12: 1CAB RI[C] <- R[A] + RI[B]J C=a+b 

13: 9C17 M[17] <- R[C] store resuilt 






14: 0000 halt 






15: 0008 integer value 8io 
16: 0005 integer value 510 
17: 0000 result 


















从 PC 的 10 处 开始 ， 该 程序 将 存储 位 置 15 和 16 处 的 两 个 数字 相 加 ， 并 将 结 
果 000D 放 入 存储 位 置 17 


eh 







Pe “oiR TIRIAT T HREB] SKECT UME 内 存 导出 
















10° 8A15 0008 10 Fs 
11 8B16 0008 0005 11 8B16 
12 1CAB 0008 0005 000D 12 1CAB 
13 “9C17 0008 0005 000D 000D [ 13 gc17 
14 0000 0008 0005 000D 000D 14 0000 
指令 执行 跟踪 15 | 0008 
16 0005 








17 000D 


LOOK ON/OFF 





0000 0000 0000 1101 一 结果 (二进制 ) 
0 0 0 D 一 结果 (十 六 进 制 ) 

操作 机 器 “我 们 通常 可 以 通过 键盘 、 显 示 器 和 触 控 板 等 IO 设备 与 计算 机 进行 通信 。 在 
某 种 意义 上 说 ，TOY 也 有 IO 设备 。 接 下 来 ， 我 们 描述 程序 员 如 何 与 像 TOY 这 样 的 机 器 进 
行 通信 ， 以 实际 运行 程序 。 左边 是 对 我 们 假想 的 TOY 
i on 机 的 前 面板 的 描述 。 对 应 控制 、 输 入 、 输 出 ， 它 只 有 
三 个 简单 的 设备 : 按钮 、 开 关 和 指示 灯 。 它 们 都 是 简 
单 的 开 /关机 制 ， 但 很 少 : 只 有 24 个 开关 和 指示 灯 、 
4 个 按钮 。 再 也 没有 其 他 任何 物件 ， 没 有 键盘 、 打 印 
机 或 显示 器 ， 也 没有 互联 网 连接 、 无 线 网 卡 、 扬 声 器 
或 触摸 板 。 只 有 按钮 来 对 应 控制 ， 开 关 对 应 输入 ， 指 
示 灯 对 应 输出 。 不 过 ， 就 像 我 们 现在 描述 的 那样 ， 这 足以 操作 一 个 基本 特征 相同 的 通用 计算 
机 来 执行 有 价值 的 计算 。 

按钮 。 也 许 计 算 机 最 基本 的 控制 就 是 打开 或 关闭 电源 。PDP-8 为 此 有 一 个 键 ，TOY 有 
一 个 按钮 。 程 序 员 要 做 的 第 一 件 事 就 是 打开 机 器 (最 后 一 件 事情 就 是 把 它 关 掉 )。 此 外 ， 另 
外 三 个 基本 功能 由 按钮 控制 ; 

。 将 字 节 加 载 (LOAD) 到 计算 机 的 内 存 中 。 
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。 查 看 (LOOK) 计算 机 内 存 中 字 的 值 。 

。 运行 (RUN) 一 个 程序 。 

我 们 稍 后 将 简短 地 讨论 这 些 功能 。 

开关 。 使 用 这 些 机 器 的 程序 员 用 开 / 关 来 表示 二 进 制 值 。 开 关 处 于 上 面 位置 时 表示 1 ; 
处 于 下 面 位 置 时 表示 0。TOY 计算 机 有 两 组 开关 : 用 于 指定 存储 器 位 置 的 8 个 开关 和 用 于 指 
定 内 存 字 的 值 的 16 个 开关 。 这 些 开关 是 TOY 的 输入 设备 。 

指示 灯 。TOY 的 输出 设备 是 开关 下 的 灯 组 。 同 样 ，8 个 灯 用 于 表示 存储 器 中 的 位 置 ， 另 
外 16 个 灯 表 示 存 储 器 中 字 的 值 。 

运行 一 个 程序 。 为 了 在 TOY 之 类 的 机 器 上 运行 程序 ， 程 序 员 通 常 首先 需要 预约 使 用 机 
器 的 时 间 ， 并 在 指定 的 时 间 到 达 机 房 ， 并 提前 将 要 执行 的 程序 写 在 一 张 纸 上 。 下 面 我 们 详细 
分 析 运 行 第 一 个 程序 所 需 的 步骤 。 为 简洁 起 见 ， 我 们 通过 指定 开关 和 灯光 的 十 六 进 制 值 来 
“以 十 六 进 制 思考 ”， 实 际 上 每 个 开关 或 灯光 对 应 一 位 。 例 如 ， 当 我 们 说 “将 DATA 开关 设置 
为 1CAB” 时 ， 我 们 的 意思 是 “打开 DATA 开关 组 中 对 应 于 位 串 0001110010101011 中 1 的 
开关 ”。 程 序 员 将 按照 下 述 步 又 实 现 和 运行 程序 6.2.1: 

e。 打 开机 器 ( 按 ON / OFF 按钮 )。 

。 将 ADDR 开关 设置 为 10， 将 DATA 切换 到 8A15， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 11,， 将 DATA 切换 到 8B16， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 12, 将 DATA 切换 到 1CAB， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 13, 将 DATA 切换 到 9C01， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 14, 将 DATA 切换 到 0000， 然后 按 LOAD。 

。 将 ADDR 开关 设置 为 1 5, 将 DATA 切换 到 0008， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 16, 将 DATA 切换 到 0005， 然 后 按 LOAD。 

。 将 ADDR 开关 设置 为 10， 然 后 按 RUN 按钮 。 

。 将 ADDR 开关 设置 为 17， 然 后 按 下 LOOK 按钮 。 

。 记 下 计算 出 的 答案 ， 如 数据 灯 (000D) 所 示 。 

。 (通常 ) 对 于 其 他 数据 值 须 重复 前 面 5 个 步骤 。 

。 关闭 机 器 ( 按 ON / OFF 按钮 )。 

总 之 ， 打 开机 器 时 ， 我 们 不 能 假定 任何 内 存 、 寄 存 器 和 PC 的 值 (除了 R[0] 是 0000 )， 
所 以 我 们 需要 加 载 程序 和 数据 (打开 机 器 之 后 的 七 个 步骤 ) 才能 运行 程序 。 运 行程 序 后， 我 
们 需要 检查 存储 结果 的 内 存 位 置 以 获得 答案 。 

我 们 有 必要 对 这 个 交互 方式 的 本 质 进行 分 析 。 从 本 质 上 讲 ， 程 序 员 一 次 只 能 与 机 器 进行 
一 位 的 通信 。 这 个 过 程 是 粗糙 简陋 的 ， 但 人 们 依旧 忍耐 着 ， 因 为 开发 程序 远 远 优 于 使 用 铅笔 
和 纸张 、 算 尺 或 机 械 计算 器 进行 计算 ， 而 且 这 是 当时 唯一 可 用 的 方法 。 我 们 很 快 就 会 看 到 许 
多 短程 序 如 何 进行 数值 计算 的 例子 ， 而 通过 其 他 方式 或 许 很 难 完成 这 些 计算 任务 。 

当然 ， 不 久之 后 出 现 了 更 好 的 输入 /输出 设备 ， 如 键盘 、 打 印 机 、 纸 带 和 磁带 ， 但 这 种 
编程 方法 当然 是 许多 科学 家 、 工 程 师 和 学 生 的 起 点 〈 是 的 ， 这 就 是 20 世纪 70 年 代 早 期 大 学 
生 学 习 编程 的 方式 )。 

条 件 和 循环 "我们 按照 第 1 章 类 似 的 讲述 办 法 ,学 习 了 TOY 程序 ， 并 学 习 了 机 器 指令 
的 数据 类 型 和 基本 操作 。 接 下 来 我 们 将 转 到 如 何 控 制 结 构 上 。 这 个 过 程 会 变 得 越 来 越 有 趣 。 

在 第 1 章 学 到 的 第 一 个 控制 流 结构 是 条 件 和 循环 。 因 此 ， 我 们 接 下 来 考虑 用 TOY 的 分 
支 语 句 来 实现 这 些 结构 。 


举 个 例子 ,考虑 如 何 计 算 两 个 正 整数 a 和 b 的 最 大 公约 数 (gcd)。 我 们 在 2.3 节 中 研究 
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了 一 种 基于 整数 除法 (有 余数 ) 的 算法 。 由 于 TOY 没有 除法 指令 ， 我 们 将 从 以 下 版 本 开始 ， 


在 Java 中 的 实现 如 下 : 
public static int gcd(int a, int b) 
while (a != b) 
if (b> a)b= b =a; 


else aa 二; 
return a; 


} 

这 个 代码 是 基于 一 个 简单 的 想法 : 如 果 b 大 于 a， 
任何 能 够 整除 a 和 b 的 数字 (如 a 和 b 的 最 大 公约 数 ) 
也 一 定 可 以 整除 b-a; 如 果 a 大 于 b， 任 何 能 够 整除 a 和 
b 的 数字 也 一 定 能 够 整除 a-b。 当 a 和 b 是 正 数 时 ， 对 
于 每 一 次 的 循环 迭代 ， 其 中 较 大 的 数字 都 会 减少 (但 依 
然 是 正 数 )， 直 到 a 和 b 相等 ， 这 就 是 a 和 b 的 最 大 公约 
数 ， 也 是 过 程 中 涉及 的 所 有 数字 的 最 大 公约 数 。 计 算 过 
程 示例 如 右 。 

这 就 是 两 千 多 年 前 提出 的 欧 几 里 得 算法 ， 直 到 今天 
我 们 依然 还 在 学 习 它 。 这 个 版 本 的 实现 有 时 可 能 会 很 慢 : 
例如 ， 你 可 能 已 经 注意 到 ， 在 刚才 的 例子 中 a 变 得 小 于 b 
之 前 ，1092 减 了 6 次 (其实 我 们 可 以 使 用 除法 取 余 数 来 完 
成 相同 的 任务 )。 如 果 其 中 一 个 数字 非常 小 ， 那 么 该 算法 
可 能 需要 的 时 间 与 另 一 个 数字 的 大 小 成 比例 。 例 如 ， 该 算 
法 需要 7214 次 迭代 ， 发 现 7215 和 7214 的 最 大 公约 数 是 
1。 不 过 请 放心 ， 比 这 更 有 效率 的 算法 的 版 本 已 经 被 相当 
详细 地 研究 了 ， 即 使 像 TOY 一 样 的 机 器 也 能 够 高 效 地 解 
决 问题 ( 见 练习 6.2.19 )。 

目前 ， 我 们 主要 关注 如 何 实现 这 个 函数 的 计算 功能 部 
分 ， 假 定 程序 员 已 经 将 输入 数据 输入 到 指定 的 内 存 位 置 ， 
如 程序 6.2.1 所 示 。 在 下 一 节 中 ， 我 们 将 讨论 如 何 将 代码 
打包 为 一 个 函数 。 

我 们 的 关键 任务 是 有 效 地 使 用 TOY 的 分 支 语句 来 实 
现 循环 和 条 件 ， 如 下 所 示 。 

为 了 实现 一 个 while 循环 ， 我 们 把 计算 表达 式 的 值 
的 代码 放 在 某 个 内 存 位 置 yy， 然 后 用 指令 COyy (一 个 无 
条 件 的 yy 分 支 ) 实现 循环 。 在 循环 中 ， 我 们 执行 计算 表 
达 式 的 代码 ， 当 且 仅 当 这 个 表达 式 的 值 是 假 的 时 候 ， 在 
某 个 寄存 器 (比如 说 R[1]) 中 写 入 0。 然 后 ， 如 果 寄 存 器 
为 0， 我 们 使 用 条 件 分 支 COxx 将 控制 转移 到 循环 之 后 的 
指令 (在 地 址 xx 处 )。 与 上 面 展 示 的 论语 名 的 实现 类 似 。 











a b 
7215 6123 
1092 6123 
1092 5031 
1092 3939 
1092 2847 
1092 1755 
1092 663 
429 663 
429 234 
195 234 
195 39 
156 39 
117 39 
78 39 
39 39 

最 大 公约 数 的 计算 轨迹 

Java 代 码 
if (< 表达 式 > ) 
< 表达 式 为 真 时 执行 的 语句 > 
else 
< 表达 式 为 假 时 执行 的 语句 > 
流程 图 
+ 
~ 





< 表达 式 为 真 时 执行 的 语 名 > 


< 表达 式 为 假 时 执行 的 语句 > 






TOY 代 码 


< 表达 式 > 对 应 的 机 器 
指令 代码 ， 当 且 仅 当 表达 
式 为 假 时 在 R[1] 中 写 入 0 


Clyy 一 ”如果 R[ 了 为 0， 则 跳 转 到 yy 








< 表达 式 为 真 时 执行 的 语句 > 


对 应 的 机 器 指令 代码 
C0zz 一 跳 转 到 zz 


YY | < 表达 式 为 假 时 执行 的 语 名 > 
对 应 的 机 器 指令 代码 


ZZ : 
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Java 代 码 
while (< 表达 式 > ) 


< 语句 > 


流程 图 





< 表达 式 > 为 假 ? 


< 语句 > 









TOY 代 码 
:| < 表达 式 > 对 应 的 机 器 指令 
代码 , 当 且 仅 当 表达 式 
为 假 时 在 R[ 了 中 写 入 0 
CIxx 一 如 果 R[1] 为 0， 则 跳 转 到 xx 
< 语句 > 对 应 的 机 器 

指令 代码 

COyy 一 跳 转 到 yy 
XXX: 

















实现 一 个 循环 

从 这 些 结构 中 可 以 看 出 ，Java 程序 中 的 任何 循环 或 条 件 都 可 以 直接 在 TOY 程序 中 实现 。 
每 行 Java 代码 只 对 应 若干 个 TOY 指令 。 作 为 进一步 的 证 据 ， 本 节 末 尾 的 一 些 练习 将 研究 在 
本 书 早期 学 到 的 Java 程序 的 TOY 指令 实现 。 与 Java 一 样 ， 在 编程 的 世界 里 ， 条 件 语句 和 
循环 语句 只 包含 几 条 指令 就 可 以 执行 数 千 或 数 百 万 条 指令 ， 甚 至 更 多 。 

在 TOY 的 程序 设计 中 ， 我 们 甚至 可 以 不 局 限于 这 几 种 条 件 和 循环 的 实现 方式 。 例 如 ， 
在 程序 6;2.2 中 ,我 们 实际 上 只 用 了 一 个 条 件 判断 ， 就 同时 实现 了 while 循环 和 让 语句 这 两 
个 条 件 语句 。 事 实 上 ， 程 序 员 可 以 使 用 分 支 跳 转 指令 来 控制 TOY 中 控制 流 的 跳 转 ， 而 这 些 
跳 转 结构 可 能 无 法 自然 地 用 条 件 语句 和 循环 实现 。 其 实 最 好 的 编程 方法 就 是 使 用 我 们 在 现代 
编程 中 使 用 的 几 个 构件 块 人 条 件 、 循 环 和 艇 套 等 )， 但 是 人 们 花 了 很 多 年 的 时 间 才 接受 这 个 
观点 。 为 了 表述 更 加 清楚 ,我们 在 本 书 中 采用 了 一 种 折 中 的 方法 ， 在 编程 时 基本 会 采用 刚刚 
分 析 的 框架 作为 模板 (同时 使 用 类 似 Java 的 代码 作为 文档 )， 但 是 当代 码 可 以 适当 简化 时 我 
们 也 会 采取 一 些 编程 的 捷径 。 

完成 了 上 述 设 计 ， 程序 员 就 可 以 使 用 开关 来 将 程序 6.2.2 的 指令 和 数据 输入 到 存储 器 中 
20 到 2D 的 位 置 上 ， 然 后 将 地 址 开关 设置 为 20， 按 下 RUN， 并 用 指示 灯 来 显示 2D 位 置 的 
值 。 运 行程 序 并 观察 指示 灯 的 结果 。 假 设 程序 计算 195 和 273. 的 最 大 公约 数 ， 结 果 会 是 39。 
程序 员 可 以 根据 需要 运行 程序 ， 在 2B 和 2C 中 输入 新 的 数字 对 ， 将 地 址 开关 重新 设置 为 
20， 按 RUN 键 并 观察 2D 中 的 结果 。 

跟踪 轨迹 是 开发 和 调试 TOY 程序 时 更 加 有 效 的 好 方法 。 首 先 ， 程 序 将 195 (00C3 ) 加 
载 到 R[A] 中 , 将 273 (0111 ) 加 载 到 R[B] 中 。 然 后 将 它们 相 减 ， 把 结果 -78 (FFC3 ) 写 入 
R[C]。 由 于 这 个 值 不 是 零 ， 进 入 循环 ， 然 后 测试 差 值 是 否 为 正 。 由 于 它 是 负 的 ， 从 R[B] 中 
减 去 RI[A],， 在 R[B] 中 留 下 78 (004E)， 然 后 返回 循环 的 男 一 次 迭代 。 在 循环 的 下 一 次 迭代 
中 ， 从 RI[A] 中 减 去 RIB]， 在 R[A] 中 保留 117 ( 0075 )。 然 后 再 次 从 R[A] 中 减 去 RI[B]， 在 
R[A] 中 留 下 39 (0027)。 循环 的 最 后 一 次 迭代 是 从 R[B] 中 减 去 RIA]， 在 两 个 寄存 器 中 都 
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留 下 结果 39 (0027 )。 

我 们 可 以 想象 ， 这 个 经 典 的 算法 使 得 早期 程序 员 通 过 不 断 的 试验 认识 到 对 于 计算 机 来 说 
计算 可 以 如 此 简单 。 是 否 有 人 可 以 用 笔 完 成 这 些 计算 呢 ? 通过 这 种 方式 实现 了 更 快 的 计算 ， 
这 使 得 一 些 数 学 家 和 科学 家 成 为 最 初 的 程序 员 。 他 们 不 断 地 追求 更 快 的 算法 ， 并 致力 于 开发 
更 有 效 的 算法 ， 直 到 今天 。 







程序 6.2.2 条件 和 和 循环: 欧 几 里 得 算法 















20: 8A2B R[A] <- M[2B] a=p 

21: 8B2C RI[B] <- M[2C] b=q 

22: 2CAB RI[C] <- R[A] - RI[B] while (a != b) 
23: CE29 if (R[C] == 0) PC < 29 { 
DAPRIt] 3 0) .PC <- 27 if (b > a) 
25: 2BBA RI[B] <- R[B] - RI[A] bi=b -a 
26>.> C022, -PE 22 else 

27: 2AAB R[A] <- R[A] - RI[B] awma -hb 
28:% C022: PGKHR2 a 

29: 9A2D return a (= b = CCD) return a 






2A: 0000 hait 














2B: 00C3 integer value 195;0 
2C: 0111 integer value 273,0 
2D: 0000 resuit 


~ 





PC 从 20 开 始 ， 程序 从 内 存 位 置 2B 和 2C 中 读 取 
两 个 数字 ， 计 算 它 们 的 最 大 公约 数 ， 并 将 结 i 果 放 在 
内 存 位 置 2D 中 。 







0000 0000 0010 0111 一 结果 (二进制 ) 
0 2 7 一 结果 (十 六 进 制 ) 





存储 程序 计算 TOY 计算 机 的 基本 特征 之 一 是 它 将 计算 机 程序 存储 为 数字 ， 并 且 数 据 
和 程序 都 存储 在 相同 的 主 存储 器 中 。 这 是 理解 计算 的 基本 性 质 的 关键 ， 也 是 经 过 曲折 历史 后 
的 深刻 教训 。 

数据 作为 指令 和 指令 作为 数据 。 如 程序 6.2.3 展现 的 这 一 基本 特征 ， 它 实现 了 一 个 数字 
序列 的 求 和 操作 。 该 序列 可 以 是 以 0000 结尾 的 任意 长 度 。 该 程序 的 操作 轨迹 如 程序 右 图 所 
示 ， 仔 细 观 察 〈 轨 迹 中 省 略 了 R[I] 和 MI[1B]， 因 为 它们 中 的 每 一 个 值 只 改变 一 次 )。 计 算 开 
始 时 和 程序 6.2.1 基本 相同 ， 后 面 就 有 很 大 差异 了 。 前 两 个 数字 相 加 并 将 结果 留 在 RIA] 中 
后 ， 程 序 将 位 置 12 的 指令 8B1D 加 载 到 及 [D] 中 ， 再 加 上 1， 然后 将 结果 8B1E 存 回 到 位 置 
12 中 。 然 后 ， 跳 转 到 位 置 12， 该 指令 用 于 向 R[B] 中 加 载 下 一 个 要 加 到 R[A] 中 的 数字 ， 如 


920 
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此 继续 循环 ， 直 到 在 数据 中 遇 到 0000 时 停止 。 














1B: 
4C: 
1D: 
EE: 
了 
20: 


程序 6.2.3 ”自修 改 代码 : 
10: 
1: 
2 
3 
14: 
9 
16: 
E> 
18: 
19: 
1A: 


7101 
8A1C 
8B1D 
CB19 
lAAB 
8D12 
1D1D 
9D12 
C012 
9A1B 
0000 


0000 
0001 
0008 
001B 
0040 
0000 





计算 一 串 数字 的 和 
R[1] <- 0001 
R[A] <- M[1C] 
R[B] <- M[1D] 
if (R[B]==0) PC <- 19 { 
R[A] <- R[A] + RIB] 

R[D] <- M[12] 

R[D] <- R[D] + 1 

M[12] <- R[D] 

PC <- 12 } 
store result 

hailt 


result 

data 

integer value 8)o 
integer valye 27;o 
integer value 6410 
















PC 从 10 开 始 ， 该 程序 将 存储 在 位 置 1C 到 1F 
(以 0000 结 尾 ) 的 数字 序列 相 加 并 将 结果 存储 
在 位 置 1B。 





0000 0000 0010 0111 一 结果 (二进制 ) 
0 0 2 


这 样 的 代码 被 称 为 自修 改 代 码 ( self-modifying code)。 我 们 之 所 以 引入 这 个 程序 ， 是 因 
为 它 简 洁 地 说 明了 存储 程序 计算 的 基本 概念 。 内 存 位 置 12 的 内 容 是 指令 还 是 数据 ? 其 实 是 
两 个 都 是 ! 当 我 们 加 1 时 ， 就 是 数据 ; 当 PC 引用 它 并 加 载 到 IR 时 ， 它 就 是 一 条 指令 。 由 
于 程序 和 数据 共享 相同 的 内 存 ， 机 器 可 以 在 执行 时 修改 其 数据 或 程序 本 身 。 也 就 是 说 ， 代 码 
和 数据 是 相同 的 ， 或 者 至 少 可 以 是 相同 的 。 当 使 用 程序 计数 器 引用 存储 器 中 的 内 容 时 它 就 是 


一 结果 (十 六 进 制 ) 


指令 ， 当 使 用 指令 引用 时 它 就 是 数据 。 


这 样 的 自修 改 代 码 在 现代 计算 中 很 少 使 用 ， 因 为 它 很 难 被 理解 、 调 试 和 维护 。 我 们 将 在 
下 一 节 中 分 析 另 一 种 数字 序列 求 和 的 方案 。 但 是 将 指令 当 作 数据 来 处 理 的 能 力 在 计算 中 是 非 
常 重要 的 ， 正 如 下 一 章 和 本 章 的 其 余部 分 所 讨论 的 那样 。 


a=a+b 
modify instruction at M[12] 
to Joad next number into 
b on next iteration 


Joad first number into a 
while (b != 0) 















M[12] 上 





R[B] 


8B1D 
8B1D 

8B1D | 
8B1D 

8B1D | 
8B1E | 
8B1E | 
8B1E 
sB1E | 
881E | 
8B1E 
8B1E 
3B1F | 
8B1F | 
8B1F | 
8B1F 

aB1F | 
8B1F | 
8B1F | 
8B20 | 
8B20 

8B20 | 
8B20 | 
8B20 


8B1D 
8B1D 





一 些 影响 。 将 程序 作为 数据 来 处 理 的 能 力 在 现代 计算 基础 架构 中 至 关 重 要 : 


。 任何 应 用 程序 (application) 在 下 载 或 安装 时 都 被 视 为 数据 ， 但 在 启动 时 将 其 视 为 


程序 。 
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。 编译 器 ( Compiler) 程序 的 功能 如 下 : 它 读 取 其 他 程序 作为 输入 数据 ， 将 其 生成 机 器 

语言 并 输出 。 所 有 的 编程 语言 都 基于 编译 器 工作 。 

。 现代 云 计算 〈cloud computing) 基于 虚拟 机 (virtual machine) 的 概念 ， 其 中 一 台 计 算 

机 运行 基于 另 一 台 计 算 机 的 程序 。 事 实 上 ，TOY 本 身 就 是 一 个 虚拟 机 器 ， 我 们 将 在 
6.4 节 中 进行 分 析 。 

这 些 只 是 一 些 例子 ， 我 们 将 在 本 章 中 重新 审视 这 个 概念 。 

将 程序 视 作 数据 并 非 没 有 漏洞 。 例 如 ， 计 算 机 病毒 是 通过 编写 新 程序 或 修改 现 有 程序 而 
传播 的 (恶意 ) 程序 。 正 如 在 第 5 章 中 学 习 的 ， 图 灵 理 论 已 经 告诉 我 们 ， 一 般 来 说 ,没有 有 
效 的 方法 来 区 分 恶意 病毒 、 有 用 的 应 用 程序 或 数据 。 这 个 缺点 是 存储 程序 模型 不 可 避免 的 后 
果 。 我们 将 在 下 一 节 中 针对 TOY 计算 机 的 环境 分 析 一 个 具体 的 示例 。 

冯 : 诺 依 曼 机 器 ”如 前 面 所 述 ， 到 20 世纪 四 五 十 年 代 ， 科 学 家 和 工程 师 们 进行 了 大 量 
的 计算 ,它们 不 仅仅 用 于 战争 ， 如 弹道 学 、 核 武器 和 密码 学 ， 而 且 还 用 于 和 平时 期 的 太空 飞 
行 和 气象 学 等 。 电 子 元 件 比 机 械 元 件 更 快 的 想法 更 加 根深 蒂 固 。 

但 是 ,许多 早期 计算 机 的 实现 方式 是 模拟 机 械 计算 器 。 运 营 商 必须 通过 插入 电缆 和 设置 
交换 机 组 来 “编程 ”计算 机 ， 这 很 烦琐 、 耗 时 且 容 易 出 错 。 所 有 内 存 都 被 用 于 存储 数据 。 例 
如 ENIAC 就 是 这 样 的 一 台 计 算 机 ， 它 在 20 世纪 40 年 代 中 期 由 Eckert 和 Mauchly 在 宾 尹 法 
尼 亚 大 学 开发 (ENIAC 被 认为 是 世界 上 第 一 台电 子 计算 机 一 一 译 者 注 )。 

与 此 同时 (实际 上 早 在 20 世纪 30 年 代 )， 数 学 领域 也 对 此 具有 极 大 的 兴趣 ， 因 为 图 灵 
发 现 了 我 们 在 第 5 章 中 分 析 过 的 巧妙 的 理论 结构 5 图 灵 的 工作 帮助 我 们 更 加 深刻 地 理解 了 计 
算 本 质 特 性 。 

普林斯顿 学 者 汉 … 诺 依 曼 是 Eckert 和 Mauchly 二 人 在 ENIAC 项 目 上 的 顾问 ， 也 是 这 个 
项 目的 继任 者 。 当 时 他 对 这 个 机 器 的 两 方面 的 应 用 充满 了 浓厚 的 兴趣 : 一 个 是 弹道 学 计算 ; 
一 个 是 原子 弹 开发 中 需要 的 精确 计算 。 

1945 年 ， 汉 “ 诺 依 曼 在 从 普林斯顿 到 洛斯 阿拉 莫 斯 的 列车 上 ， 写 下 了 他 对 ENIAC 进行 
改进 的 报告 ， 这 就 是 EDVAC 报告 的 初稿 。 在 这 份 备 忘 录 中 完整 描述 了 存储 程序 计算 模型 。 
由 于 汉 “ 诺 依 曼 是 普林斯顿 大 学 的 教授 ， 而 图 灵 是 该 校 的 研究 生 ， 所 以 他 受到 了 图 灵 思 想 的 
影响 ， 而 且 用 一 种 独特 的 方法 将 图 灵 理 论 与 Eckert 和 Mauchly 面临 的 实际 挑战 结合 了 起 来 。 
冯 “' 诺 依 曼 抵 达 洛 斯 阿拉 葛 斯 后 不 入， 一 位 名 叫 赫 尔 曼 ， 戈 德 斯 坦 (Herman Goldstine) 的 
少尉 意识 到 这 个 想法 会 引起 大 们 的 浓厚 兴趣 ， 并 且 广 泛 地 传阅 了 这 份 备忘录 。 世 界 各 地 的 科 
学 家 立即 看 到 了 存储 程序 模型 的 价值 ， 基 于 该 模型 的 计算 机 ( 郊 
乎 所 有 的 计算 机 都 基于 这 个 模型 ) 都 被 称 为 冯 ，. 诺 依 曼 机 器 。 许 
多 历史 学 家 认为 ，Eckert 和 Mauchly 应 该 得 到 这 一 殊荣 (就 像 图 
灵 一 样 )， 但 无 疑 是 冯 : 诺 依 曼 的 备忘录 使 得 这 一 构思 在 世界 各 地 
生根 发 芽 。 

存储 程序 模型 使 计算 机 能 够 执行 任何 类 型 的 计算 ,而 不 需 
要 用 户 做 物理 上 的 改变 或 重新 配置 硬件 。 自 从 汉 … 诺 依 曼 第 一 次 
曾 述 它 以 来 ， 这 个 简单 且 基本 的 模型 几乎 已 经 被 用 于 所 有 的 计算 
机 中 。 

现在 看 来 ， 冯 … 诺 依 曼 的 架构 显而易见 。 然 而 ， 当 时 有 许多 
研究 小 组 正在 朝 不 同 的 方向 工作 ， 而 到 底 是 使 用 存储 程序 模型 构 ” 汉 . 诺 依 曼 ( 1903 一 1957 ) 
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建 计算 机 还 是 应 该 构建 能 够 重新 布线 和 重新 配置 的 计算 机 仍 存在 争议 。 事 实 上 ， 图 灵 的 理论 
表明 ， 只 要 一 台 计 算 机 的 基本 指令 集 足 够 丰富 (TOY 计算 机 的 指令 就 已 经 足够 ) 那么 无 论 
在 物理 上 再 怎么 改装 或 者 重 配置 ， 都 不 能 使 它 解决 更 多 问题 = 除 图 灵 之 外 ， 汉 … 诺 依 曼 是 世 
界 上 为 数 不 多 的 同意 这 一 观点 的 人 之 一 。 他 将 一 次 火车 旅途 中 的 偶然 发 现 完 整地 表达 出 来 ， 
而 这 改变 了 整个 世界 。 

问答 环节 

问 : 程序 员 真 的 会 通过 拨 动 开关 来 输入 程序 吗 ? 

答 : 是 的 。 很 多 人 都 学 会 了 这 个 技巧 。 即 使 有 更 好 的 输入 /输出 设备 可 用 ， 也 需要 通过 
开关 来 输入 其 中 一 个 设备 的 驱动 程序 。 

问 : 寄存 器 和 内 存 字 有 什么 区 别 ? 

答 : 它们 都 可 以 存储 16 位 整数 ， 但 它们 在 计算 机 内 扮演 不 同 的 角色 。 内 存 的 目的 是 
保存 程序 和 数据 一 一 我 们 希望 内 存 尽 可 能 大 。 寄 存 器 的 目的 是 提供 一 个 中 转 存储 ， 以 便 从 
ALU 获取 数据 或 者 向 ALU 发 送 数据 ， 我 们 只 需要 有 限 数量 的 寄存 器 。 通 常情 况 下 ， 计 算 机 
使 用 更 昂贵 技术 的 寄存 器 ， 因 为 它们 几乎 在 每 个 指令 都 会 被 用 到 。 计 算 机 中 的 寄存 器 数量 是 
三 个 设计 决策 s 

问 : 专用 计算 机 或 专用 微 处 理 器 今天 还 在 制造 吗 ? 

答 : 是 的 ， 因 为 在 硬件 上 实现 ， 可 以 做 得 比 在 软件 中 更 快 地 完成 简单 的 事情 。 

问 : 很 难 想象 会 存在 没有 循环 语句 和 条 件 语 句 的 编程 语言 。 人 们 真 的 那样 编程 过 吗 ? 

答 : 当然 。 程 序 员 用 流程 图 设计 他 们 的 逻辑 ， 而 早期 的 高 级 语言 有 一 个 “goto ”语句 ， 
它 可 以 直接 转换 成 机 器 语言 的 分 支 跳 转 语句 。 学 术 界 很 早 就 出 现 了 使 用 循环 、 条 件 和 函数 的 
“结构 化 编程 ”思想 ， 但 直到 20 世纪 70 年 代 才 被 许多 程序 员 认 真 对 待 。 一 个 著名 的 转折 点 
是 E.W.Dijkstra 在 1968 年 给 《ACM 通信 》(the Communications ofthe ACM) 编辑 的 一 封 信 ， 
题目 是 《 Goto 被 认为 是 有 害 的 》( Goto considered harmful)。 在 这 封 信 中 ， 他 主张 在 所 有 高 
级 编程 语言 中 废除 goto 语句 ， 因 为 使 用 它 的 程序 很 难 理解 、 调 试 和 维护 。 这 个 观点 用 了 十 
年 才 被 普遍 接受 ， 而 结构 化 编程 自 此 以 后 被 认为 是 理所当然 的 。 


练习 


6.2.1 TOY 的 存储 空间 有 多 少 位 ? 计 上 所 有 的 寄存 器 (包括 PC) 和 主 存储 器 。 

6.2.2 TOY 使 用 8 位 内 存 地 址 ， 这 意味 着 内 存 可 以 有 256 个 字 长 。 我 们 可 以 使 用 32 位 地 址 处 理 多 少 
个 字 长 的 内 存 ? 64 位 地 址 呢 ? 

6.2.3 ”假设 我 们 要 使 用 与 TOY 相同 的 指令 格式 ， 但 是 使 用 32 位 地 址 。 我 们 需要 什么 字 长 ? 描述 使 用 
这 个 设计 方案 可 能 会 出 现 的 问题 。 

6.2.4 给 出 一 条 指令 ， 将 程序 计数 器 更 改 为 内 存 地 址 15， 而 不 管 任何 寄存 器 或 内 存单 元 的 内 容 如 何 。 
答案 : C015 或 F015。 两 条 指令 都 依赖 于 R[0] 始终 为 0000 的 事实 。 

6.2.5 列 出 七 条 指令 (都 有 不 同 的 操作 码 )， 将 0000 放 入 寄存 器 A。 
答案 :; 1A00，2Axx，3A0x,， 4Axx，5A0x，6A0x，7A00， 其 中 x 是 任何 十 六 进 制 数字 。 

6.2.6 列 出 三 种 方式 (不同 的 操作 码 ) 将 程序 计数 器 PC 设置 为 00， 而 不 改变 任何 寄存 器 或 存储 单元 
的 内 容 。 
答案 : C000,，E0xy，F000。 
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6.2.7” 列 出 五 个 指令 (全 部 具有 不 同 的 操作 码 )， 它 们 的 功能 是 空 操作 。 排 除 第 二 位 数字 为 0 的 情况 。 


6.2.8 


6.2.9 


6.2.10 


6.2.11 
人 之 ,了 之 


6.2.13 


6.2.14 


5 


6.2.16 


G6.2:17 


6.2.18 


答案 : 1xx0，1x0x，2xx0，3xxx，5xx0，6xx0 或 DO0xx， 其 中 x 是 除 0 之 外 的 任何 十 六 进 制 数 字 。 
列 出 六 种 方法 将 R[B] 的 内 容 赋值 给 R[A]。 

答案 : 1AB0，1A0B; 2AB0, 3ABB, 4A0B,，4AB0，5AB0 和 6AB0。 

TOY 中 没有 支持 非 负 判断 的 分 支 语 句 。 请 说 说 如 何 实 现 如 果 R[A] 大 于 或 等 于 0， 则 跳 转 到 内 
存 地 址 15。 

答案 : 按 顺 序 使 用 正 数 判断 分 支 语句 和 值 为 0 的 判断 分 支 语句 : CA15 DA15。 


填写 本 表格 中 的 空格 : 


二 进 制 二 六 进 制 TOY 指 令 
0001001000110100 | 1234 | R[2] <- R[3] + R[4] 
1111111111111111 | FFFF 


1111101011001110 | FACE 
0101011001000100 | 5644 | 
















0101000001000011 | 5043 | 


0001110010101081X| CABEi 这 各 直 站 二 守 训 天 
| | REF] <- REF] & REF] 

| | Riel < mss] | 
a Wael 
| [if CREC] == 0) PC <- CC 
TOY 中 没有 绝对 值 函数 。 给 出 一 系列 TOY 指令 ,将 R[s] 的 绝对 值 存储 为 R[d]。 

TOY 中 没有 按 位 NOR 操作 符 。 给 出 一 组 三 个 TOY 指令 的 序列 ， 当 且 仅 当 R[s] 和 R[t 相应 位 
中 的 一 个 或 两 个 为 0 时 ， 将 R[d] 的 对 应 位 设置 为 1。 

TOY 中 没有 按 位 OR 运算 符 。 给 出 一 组 三 个 TOY 指令 的 序列 ， 当 且 仅 当 R[s] 和 R[t] 相应 位 
中 的 一 个 或 两 个 为 1 时 ,将 R[d] 的 每 个 对 应 位 设置 为 0。 

答案 : 3DAB 4EAB 1CDE。 

TOY 中 没有 按 位 NAND 运算 符 。 给 出 一 组 三 个 TOY 指令 的 序列 ， 当 且 仅 当 R[s] 和 了 RI 中 的 
相应 位 都 是 1 时， 将 R[d] 的 相应 位 设置 为 0。 

TOY 中 没有 按 位 NOT 运算 符 。 给 出 一 组 三 个 TOY 指令 的 序列 ， 将 R[d] 的 每 个 位 设置 为 R[s] 
中 对 应 位 值 的 相反 数 。 

答案 : 7101 2B01 4BAB 或 7101 2B01 2BBA。 

证 明 减 法 运算 符 是 多 余 的 。 也 就 是 说 ， 解 释 如 何在 不 使 用 操作 码 2 的 TOY 指令 序列 来 计算 
Rd = Rs-Rt。 

16 个 TOY 指令 中 哪个 用 不 全 这 16 位 ? 

答案 : 停机 ( 仅 使 用 前 4 位 )， 间 接 加 载 (不 使 用 第 3 个 十 六 进 制 数 字 )， 间 接 存储 (不 使 用 第 
3 个 十 六 进 制 数字 )， 跳 转 寄 存 器 (不 使 用 两 个 十 六 进 制 数 字 ) 

根据 TOY 的 二 进 制 补 码 的 规则 ， 我 们 会 把 一 些 整 数 解释 为 负数 。 这 种 情况 对 于 哪些 指令 会 有 
影响 ? 

答案 : 判断 为 正 的 分 支 指令 将 0001 和 7FFF 之 间 的 整数 视 为 正 数 。 右 移 指 令 是 一 个 算术 移 位 ， 
所 以 如 果 最 左边 的 位 是 1， 则 空 出 的 位 置 用 1 来 填充 。 所 有 其 他 指令 (甚至 减法 ! ) 并 不 关心 
TOY 是 否 具有 人 负 整 数 。 


6.2.19 按照 下 面 的 方法 修改 while 循环 ， 以 改进 文本 中 给 出 的 最 大 公约 数 算法 在 TOY 上 的 实现 。 这 
里 需要 增加 一 个 初始 化 为 0 的 变量 ce， 并 对 循环 做 如 下 修改 : 
。 如 果 a 和 ob 是 偶数 ， 则 gcd (a,b) =2 gcd (a/2,b/2)， 所 以 将 a 和 b 除 以 2 并 将 c 增 加 1。 
。 如果 a 是 偶数 并 且 b 是 奇数 ， 则 gcd (a, b) = gcd (a/2, b) 将 a 除 以 2。 
。 如 果 a 是 奇数 ，b 是 偶数 ， 则 将 b 除 以 2 (道理 同上 )。 
。 否则 ，a 和 都 是 奇数 ， 按 照 以 前 的 方式 进行 ( 即 用 它们 的 差 取代 两 者 中 更 大 的 一 个 )。 

最 后 ， 将 计算 得 到 的 结果 左 移 c 位 ， 用 于 补偿 在 计算 过 程 中 略 去 的 因子 2。 设 计 一 个 客户 

程序 ， 它 从 标准 输入 读 入 两 个 整数 ， 并 将 计算 出 的 最 大 公约 数 打 印 到 标准 输出 。( 分 析 表 明 ， 
该 算法 的 最 坏 情 况 运行 时 间 是 输入 数据 位 数 的 平方 级 一 一 这 比 正文 中 给 出 的 版 本 快 得 多 。 分 
析 的 细节 超出 本 书 讨论 的 范围 ， 我 们 不 再 展开 。) 


6.3 ”机 器 语言 编程 


在 本 节 中 ， 我们 将 继续 描述 如 何在 TOY 中 实现 我 们 在 本 书 前 面 所 学 习 的 Java 语言 
制 ， 并 完成 一 些 TOY 计算 机 上 有 趣 的 编程 任务 。 我 们 的 主要 目标 是 让 你 相信 ，TOY 编程 与 
Java 编程 一 样 有 趣 、 令 人 满意 ，TOY 比 想象 的 要 强大 得 多 。 

具体 来 说 ， 我 们 会 学 习 如 何在 TOY 的 程序 中 实现 函数 、 数 组 、 标 准 输 入 输出 和 链接 结 
构 ， 也 就 是 我 们 前 面 学 过 的 编程 的 基本 构建 块 。 理论 上 ， 这 些 结构 表明 可 以 开发 与 我 们 编写 
的 任何 Java 程序 相对 应 的 机 器 语言 程序 。 事 实 上 也 确实 是 这 样 的 ， 因 为 Java 编译 右 就 是 这 
样 做 的 。 

当然 ， 在 资源 方面 可 能 会 存在 限制 。 我 们 真 的 能 用 4096 位 的 内 存 完成 实际 的 计算 任务 
吗 ? 本 节 的 目标 之 一 就 是 说 服 你 ,我 们 当然 可 以 。 不 过 ， 技 术 的 进步 已 经 使 这 种 限制 变 得 
很 小 。 在 6.4 节 中 ， 我 们 将 讨论 TOY 的 扩展 ,使 它 在 这 方面 看 起 来 更 像 是 一 个 现代 计算 机 ， 
但 不 会 改变 编程 模型 。 在 这 样 的 机 器 上 ， 你 当然 可 以 编写 TOY 程序 来 执行 任何 计算 任务 ， 
就 像 你 编写 Java 程序 在 你 的 计算 机 上 执行 的 计算 一 样 。 

在 实践 层面 上 ， 你 会 发 现 用 机 器 语言 实现 各 种 任务 都 是 切实 可 行 的 。 实 际 上 ， 许 多 早 
期 的 应 用 程序 就 是 这 样 实现 的 ， 而 且 这 种 状况 维持 了 很 多 年 ， 因 为 当时 使 用 高 级 语言 的 性 能 
损失 太 大 了 。 事 实 上 ， 大 多 数 这 样 的 代码 是 用 汇编 语言 (assembly language) 编写 的 ， 汇 编 
语言 类 似 于 机 器 语言 ， 只 是 它 允 许 操作 码 、 寄 存 器 和 内 存 位 置 使 用 特定 的 符号 名 称 〈 见 练习 
6.4.13 ) 来 表示 。 在 20 世纪 70 年 代 ， 用 汇编 语言 写 就 的 、 可 以 扩展 到 数 以 万 行 计 的 代码 并 
不 罕见 。 所 以 我 们 也 是 在 回顾 历史 , 但 即使 是 现在 ， 人 们 也 会 为 性 能 关键 的 应 用 程序 编写 这 
样 的 代码 。 

最 重要 的 是 ,我 们 的 目标 是 让 你 了 解 计算 机 在 运行 程序 时 具体 做 了 什么 。 

函数 -在 条 件 和 循环 之 后 ， 我 们 在 第 2 章 中 学 习 的 下 一 个 控制 流 结构 就 是 函数 
( function)。TOY 的 跳 转 指令 是 为 此 目的 而 设计 的 。 实 现 函 数 的 方式 有 很 多 种 ， 由 于 我 们 的 
主要 目标 是 展示 这 个 概念 ， 所 以 我 们 选择 其 中 最 简单 的 一 种 方法 来 进行 。 要 实现 一 个 函数 ， 
我 们 必须 : 

。 将 控制 流转 移 到 该 函数 ; 

。 将 客户 程序 的 参数 传递 给 函数 ; 

。 从 函数 返回 一 个 值 给 客户 程序 ; 

。 将 控制 权 交 还 给 客户 程序 。 
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我 们 选择 使 用 寄存 器 来 帮助 程序 完成 这 些 任务 。 对 于 欧 几 里 得 算法 ， 我 们 按照 以 下 步 又 
进行 : 

。 使 用 TOY 的 跳 转 和 和 链接 (jump and link) 指令 来 将 控制 权 交 给 函数 。 该 指令 还 将 返回 
地 址 (客户 程序 中 下 一 条 指令 的 存储 器 地 址 ) 保存 在 一 个 寄存 器 中 (我 们 使 用 R[F])。 

。R[A] 和 R[B] 用 于 存储 参数 和 返回 值 。 

。 使 用 TOY 的 寄存 器 跳 转 (jump register) 指令 将 控制 权 返 回 给 客户 程序 。 具 体 而 言 ， 
指令 EF00 用 于 将 PC 设置 为 R[F] 中 保存 的 返回 地 址 。 

一 个 函数 调用 的 典型 控制 流程 如 下 图 所 示 。 








客户 程序 代码 
的 起 始 地 址 
| 函数 代码 的 
起 始 地 址 
ee ee | 
际 XX: 
YY: FFxx < 一 调用 (R[F] = yy+1, branch to xx)》 
yy+l1: EF00 We 
< 客户 程序 代码 返回 ( 跳 转 到 R 
的 其 他 部 分 > [EI 中 保存 的 地 址 ) 
一 个 函数 调用 的 实现 


例如 ， 通 过 上 面 的 方法 ， 很 容易 将 程序 6.2.2 中 的 代码 转换 为 计算 RIA] 和 R[B] 的 最 
大 公约 数 (GCD) 的 函数 ， 将 结果 留 在 RI[A] 和 R[B] 中 : 将 M[29] 更 改 为 寄存 器 跳 转 指令 
EF00， 以 便 客户 程序 可 以 使 用 跳 转 和 链接 指令 FF22 来 调用 该 函数 。 这 段 代 码 实现 如 下 。 
22: 2CAB RI[C] <- R[A] - RI[B] < a-b 


23: CCC if (RICY se 0) PC SC ™ Wh TE CIT 
7 


25: 2BBA R[B] <- R[B] - R[A] Be b= a 
一 个 计算 GCD 的 函数 | 26: C022 PC <- 22 else 

27: 2AAB R[A] <- R[A] - R[B] a 3b 

288s; /C022 PC =i22 } 

29:~~EF00 ”PC <-= R[F] return 


[R[A] = R[B] = GCD] 


程序 6.3.1 是 使 用 这 个 GCD 函数 来 测试 一 个 整数 是 否 为 素数 的 客户 程序 (与 前 面 的 问题 
一 样 ， 如 果 我 们 有 除法 指令 的 话 ， 这 个 任务 会 容易 很 多 ! )。 方 法 很 简单 : 当 且 仅 当 它 和 每 
个 比 它 小 的 正 整数 的 最 大 公约 数 都 是 1 时 ， 这 个 数字 就 是 素数 (如 果 一 个 数字 有 大 于 1 的 约 
数 ， 这 个 数字 和 约 数 的 最 大 公约 数 是 约 数 本 身 )。 与 程序 2.3.1 一 样 ， 我 们 可 以 在 到 达 最 小 约 
数 的 上 限 后 停止 计算 。 由 于 我 们 没有 平方 根 函 数 ， 所 以 我 们 只 能 使 用 255 作为 这 个 上 限 ， 因 
为 255? 大 于 任何 用 补 码 形式 表示 的 正 的 16 位 二 进 制 数 (或 者 ,我 们 可 以 用 一 些 其 他 方法 很 
容易 地 计算 给 定数 字 的 平方 根 的 一 些 上 限 )。 

程序 下 面 显示 函数 调用 之 前 和 之 后 ， 以 及 达到 停机 指令 时 RI[9]、R[A] 和 R[B] 的 值 。 

请 注意 ， 该 函数 使 用 R[C]， 因 此 调用 程序 不 能 期 望 RIC] 在 函数 调用 之 后 有 具 与 调用 之 
前 相同 的 值 。 而 且 ， 函 数 当 然 不 能 使 用 R[9]， 因 为 调用 程序 在 那里 保存 了 一 个 索引 ， 也 不 
能 使 用 R[F]， 因 为 返回 地 址 保存 在 那里 。 在 资源 如 此 稀缺 的 情况 下 ， 这 种 程序 中 的 “契约 ” 
在 这 个 层面 的 编程 中 起 着 重要 的 作用 ， 我 们 在 后 面 会 经 常 遇 到 。 
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与 条 件 和 循环 一 样 ， 我 们 可 以 在 TOY 中 实现 一 些 在 Java 中 不 是 很 方便 实现 的 函数 调用 
机 制 。 例 如 ， 我 们 可 能 使 用 多 个 寄存 器 作为 返回 值 。 在 一 些 情况 下 ， 一 些 程序 员 在 调用 函数 
之 前 会 保存 所 有 寄存 器 ; 也 存在 完全 相反 的 情况 ， 一 些 程序 员 会 要 求 每 个 函数 负责 保存 所 有 
寄存 器 的 值 ， 然 后 再 继续 执行 ， 在 从 函数 返回 时 将 其 恢复 到 原始 值 。 现 代 函 数 调用 机 人 制 倾向 
于 后 一 种 方法 。 

程序 6.3.1 中 使 用 的 函数 调用 机 制 无 法 实现 函数 递归 ， 但 很 容易 使 用 堆栈 开发 更 简单 的 
机 制 (参见 练习 6.3.27 ) 。 像 往常 一 样 ， 我 们 的 目的 不 是 要 覆盖 所 有 的 细节 ， 而 只 是 为 了 说 
服 你 ， 我 们 在 TOY 这 样 的 机 器 上 实现 在 Java 中 的 基本 构造 并 不 是 很 难 。 





















程序 6.3.1 ”调用 函数 : 检测 素数 
30: 7101 R[1] <- 0001 
31: 75FF R[5] <- 255 
32: 7901 R[9] <- 0001 i=1 
33: 2C59 R[C] <- R[5] - R[9] while (i < 255) 
34: CC3B “if (REC] == 0) PC <- 3B 


35: -1991  R[9] <- R[9] + RI[1] 和 = 者 

36: 1A09 R[A] <- R[9] an 

37: 8B3D R[B] <- M[3D] b 三 站 

38: FF22* “REF] <=~PC; PC <- 22 a= b= gcd(a, b) 

39: 2AAL R[A] <- R[A] - RI[1] if (gcd(a, b) != 1) break 
3A: ,CA36 if(R[A] == 0) PC.<-36 ,} 

3B: 9B3E M[3E] <- R[B] x= 1 iff p is prime 


: 0000 halt 





3D; 005B jinteger value 91)0 
: 0000 result 》 





PC 从 30 开 始 ， 程 序 测试 MI3D] 中 的 数字 p 是 否 为 素数 ， 如 果 是 ， 则 结果 为 1， 
否则 为 大 于 1 的 最 小 约 数 。 程 序 使 用 前 面 的 gcd0 函 数 ， 这 段 程序 由 程序 6.3.2 修 
改 而 来 ， 用 指令 FF22 调 用 它 。 








IR 
37 8B3D 0002 005B 0002 0000 
38 FF22 “0001 0001 0002 0000 
37 8B3D 0003 005B 0003 0000 
38 FF22 0001 0001 0003 0000 
37 8B3D 0004 005B ”0004 0000 
38 FF22 0001 0001 0004 0000 
37 8B3D 0005 005B 0005 0000 
38 “FF22 0001 0001 0005 0000 
37 8B3D 0006 005B 0006 0000 
38 FF22 0001 0001 0006 0000 
37 8B3D 0007 005B 0007 0000 
38 FF22 0007 0007 0007 0007 
3B 0000 0006 0007 0007 0007 


当 PC 在 37、38 、3B 时 的 追踪 













gcd(i, 91) 


这 个 例子 说 明 我 们 一 直 在 讨论 的 Java 模块 化 编程 的 优势 也 适用 于 TOY 程序 。 一 旦 我 们 
用 于 计算 GCD 或 用 于 测试 素数 的 代码 已 经 被 调试 ， 我 们 就 可 以 在 其 他 程序 中 使 用 它 ， 可 以 
用 单个 TOY 指令 访问 。 这 种 能 力 使 得 迅速 提高 机 器 语言 编程 的 抽象 层 开发 变 得 可 行 ， 并 发 
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展 出 了 我 们 今天 仍然 使 用 的 软件 基础 设施 的 许多 方面 。 

标准 输出 ”当然 ,计算 机 发 明之 后 最 早 取 得 的 进展 之 一 是 与 计算 机 进行 通信 的 更 好 方 
式 。 我 们 使 用 了 大 量 不 同 的 设备 ， 而 不 再 只 是 使 用 开关 和 指示 灯 。 我 们 为 TOY 选择 了 一 种 
仅 含有 基本 要 素 的 通信 手段 : 打 孔 纸 带 ( punched paper tape)。 与 TOY 本 身 一 样 ， 对 你 而 言 
这 种 方法 可 能 看 起 来 非常 粗糙 ， 但 它 被 广泛 使 用 了 至 少 十 年 。 

打 孔 纸 带 是 一 种 简单 的 介质 ， 以 非常 明显 的 方式 编码 三 进 制 数字 。 对 于 TOY， 我 们 使 
用 的 编码 非常 类 似 于 我 们 已 经 提 到 过 的 旧版 PDP-8 计算 机 上 使 用 的 编码 。 每 个 16 位 二 进 制 
数 被 编码 在 纸 带 上 连续 的 两 行 上 ， 其 中 每 行 可 以 编码 八 位 ， 在 对 应 于 1 的 位 置 上 打 孔 (对 应 
于 0 的 位 置 上 没有 了 筷 )。 沿 着 纸 带 的 中 心 是 一 系列 规则 间隔 的 小 孔 ， 过 去 通过 这 些小 孔 和 枪 
轮 之 间 的 行进 来 拉动 纸 带 。 纸 带 打 和 孔 机 将 从 计算 机 中 取出 一 个 16 位 的 二 进 制 字 ， 对 与 该 字 
对 应 的 孔 位 进行 打 孔 (两 行 )， 并 推进 纸 带 准备 打 孔 下 一 个 字 。 程 序 员 可 以 编写 一 个 程序 在 
纸 带 上 打出 信息 ， 然 后 查看 纸 带 (或 者 如 我 们 将 看 到 的 ， 稍 后 将 其 反馈 到 机 器 中 )， 而 不 是 
使 用 指示 灯 和 开关 。 


PDP-8 TOY 





1A80,, = 0001101010110000 





真实 的 和 想象 中 的 纸 带 


我 们 如 何 指示 TOY 计算 机 在 纸 带 上 输出 一 个 字 ? 这 个 问题 的 答案 很 简单 : 我 们 为 此 预 
留 了 内 存 位置 FF， 当 我 们 连接 人 硬件 后 ， 每 当 程 序 在 该 位 置 存储 一 个 字 时 ， 纸 带 打 孔 器 就 会 
被 激活 以 在 纸 带 上 打出 该 字 的 内 容 。 

程序 6.3.2 是 一 个 例子 ， 用 于 计算 斐 波 那 契 数字 并 在 纸 带 上 打印 出 它们 。 计 算 很 简单 : 
我 们 在 R[A] 和 R[B] 中 保存 前 两 个 斐 波 那 契 数 ， 其 中 R[A] 初始 化 为 0，R[B] 初始 化 为 1s 
然后 我 们 进入 一 个 循环 ,通过 将 R[A] 和 了 R[B] 相 加 的 结果 记 为 RIC]， 以 计算 出 下 一 个 斐 波 
那 契 数字 ; 然后 将 REB] 复制 到 RI[A]，R[C] 复制 到 R[B]。 每 次 循环 时 ， 我们 都 执行 指令 
9AFF， 它 将 在 纸 带 上 打印 出 RIA] 的 内 容 。 结 果 输 出 纸 带 显示 在 程序 下 面 。 如 果 将 纸 带 的 内 
容 与 其 右 侧 的 轨迹 进行 比较 ， 可 以 在 纸 带 上 读 到 斐 波 那 契 数字 的 二 进 制 形 式 ， 就 像 对 TOY 
进行 编程 的 人 读 取 数据 那样 。 

请 注意 ，TOY 程序 没有 明确 提 到 纸 带 ; 它 只 是 执行 9AFF 指令 ， 这 一 简单 的 概念 使 得 
我 们 可 以 在 不 必 改 变 TOY 程序 的 基础 上 ， 用 不 同 的 输出 设备 (可 能 是 电 传 打印 机 或 纸 带 
设备 ) 替换 纸 带 打 孔 机 。 这 样 的 设计 就 是 标准 输出 抽象 的 先驱 ， 我们 到 现在 还 在 使 用 这 个 
理念 。 


六 
933 
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和 这 6.3.2 标准 给 出: 斐 波 那 契 数 列 
40:” 7101 R[1] <- 0001 









41: 7A00 RI[A] <- 0000 人 去- 全 

42: 7B01 R[B] <= 0001 b 二 "于 

43: 894C R[9] <- M[4C] 二 人 

44: C94B if (CR[9] == 0) PC <- 4B while (i > 0) { 
45: 9AFF RI[A] to stdout print(a) 


46: ICAB RI[C] <- RI[A] + RI[B] c=a+b 

47: 1ABO RI[A] <- RI[B] 

48: 1BCO RI[B] <- RI[C] 

49: 2991 RI[9] <- R[9] - 1 

4A:; C044 PC <- 44 } 
0000 ha 







2 
[er 
-NT 






1 
上 













4C: 000C .7Tnteger value 12io n 










PC 从 40 开 始 ， 程 序 在 标准 输出 上 写 入 前 x 个 非 零 非 波 那 契 数 ， 其 中 n 是 内 存 
位 置 4C 的 整数 值 。 






输出 纸 带 


值得 注意 的 是 ， 纸 带 实 现 了 标准 输出 最 重要 的 特征 之 一 : 对 纸 带 的 长 度 没有 限制 。 这 种 
额外 的 功能 使 得 我 们 可 以 编写 出 产生 无 限量 输出 的 程序 。 这 个 能 力 不 仅 具有 实际 意义 〈 即 使 
TOY 是 一 个 小 机 器 ， 它 可 以 进行 大 量 的 计算 并 产生 大 量 的 输出 )， 而 且 它 对 计算 理论 也 有 着 
深远 的 影响 ， 正 如 我 们 在 第 5 章 中 学 习 的 那样 。 

标准 输入 ”当然 ， 从 纸 带 读 取 信息 的 设备 与 在 纸 带 打 孔 的 设备 同时 出 现 。 一面 是 光源 ， 
另 一 面 是 16 个 传感器 ， 可 以 快速 地 从 纸 带 上 读 取 两 行 ， 用 作 一 个 二 进 制 字 的 值 ，!1 对 应 于 打 
孔 , 0 对 应 于 无 孔 。 同 样 ， 与 纸 带 中 心 的 小 孔 匹配 的 齿轮 将 把 纸 带 拉 到 准备 读 下 一 个 字 的 位 置 。 

要 从 输入 纸 带 读 取 一 个 字 ， 你 可 能 已 经 猜 到 我 们 会 再 次 使 用 内 存 位 置 FF 来 达到 此 目 
的 。 在 这 种 方案 中 ,我 们 连接 硬件 ， 使 得 每 当 程序 从 该 位 置 加 载 一 个 字 时 ， 纸 带 打 孔 器 被 激 
活 以 从 纸 带 读 取 16 位 并 将 它们 加 载 到 指定 的 寄存 器 。 

有 了 标准 输入 的 支持 ， 使 用 TOY 进行 数据 处 理 则 非常 简单 ， 如 程序 6.3.3 所 示 。 只 需 
要 7 个 TOY 指令 ， 我 们 就 可 以 计算 输入 纸 带 上 的 数字 总 和 。 下 面 所 示 的 例子 证 实 了 这 一 点 : 

l1+8+27+64+125+216+343+512= 1296 
这 个 程序 显然 可 以 泛 化 到 处 理 输入 数据 的 各 种 计算 ， 而 这 样 的 计算 机 在 过 去 被 大 量 使 
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用 。 事实 上 , 一 人 台 机 器 装载 一 个 小 程序 并 不 奇怪 ,然后 它 就 可 以 交 由 操作 员 简 单 地 设置 纸 
带 ， 运 行程 序 ， 并 整 天 在 输出 纸 带 上 收集 输出 。 能 够 有 效 处 理 数据 所 带 来 的 价值 毋庸 置疑 。 
需要 指出 的 是 ， 输 入 数据 的 数量 可 能 是 无 限 的 ， 这 是 一 个 反映 计算 理论 本 质 的 深刻 概念 。 












程序 6.3.3” 标 准 输 入 : 求 和 计算 
: 7800 





R[8] <- 0000 int sum = 0 


52:° CC55 “if, (RIC] ;1900 PC <- 551° 4{ 
S344. TC0BE HE <= 51 


55: 98FF RI[8] to stdout print(sum) 
: 0000 halt 








0001i6 = 0 
000816 = 8i0 
001Bi <727% 
004016 = 6410 


00D81s = 21610 


015716 = 34310 输出 纸 带 


0200is = 51210 


输入 纸 带 
数组 ”能够 批量 读 取 大 量 数据 的 能 力 导致 需要 将 数据 保存 在 存储 器 中 以 对 其 进行 处 理 。 


当然 ， 这 带 来 了 我 们 在 TOY 中 的 第 一 个 数据 结构 一 一 数组 
(array)。 我 们 使 用 一 种 很 自然 地 数组 表示 方式 ， 就 像 我 们 先前 
在 Java 中 描述 的 那样 ， 将 数组 条 目 存储 在 一 个 连续 的 内 存 字 序 
列 中 ,但 是 我 们 将 该 长 度 存储 在 数组 末尾 而 不 是 开始 位 置 ， 如 
右 图 所 示 。 我 们 用 那个 表示 长 度 的 字 的 地 址 来 表示 这 个 数组 。 
我 们 习惯 于 将 长 度 放 在 内 存 区 域 开 头 的 位 置 ， 但 是 这 种 方法 在 
原理 上 并 没有 什么 差异 : 它 保留 了 一 个 基本 特征 ， 即 我 们 可 以 
通过 将 一 个 a[0] 的 地 址 加 上 i 来 计算 出 api 的 地 址 ， 并 且 可 以 
很 容易 地 从 数组 地 址 中 计算 出 af0] 的 地 址 ( 减 去 长 度 )。 

TOY 间接 加 载 〈(1load indirect) 指令 和 间接 存储 (store 
indirect) 指令 的 主要 目的 之 一 就 是 支持 数组 处 理 。 我 们 将 afj] 
的 地 址 保存 在 一 个 寄存 器 中 。 然 后 ， 为 了 加 载 /存储 数组 值 中 
第 n 位 值 ， 我 们 使 用 间接 加 载 /存储 (load/store indirect) 指令 ， 
将 它 加 载 到 指定 的 寄存 器 中 。 


51: 8CFF RI[C] From stdin while ((c = read()) != 0) 


53: 188C R[8] <- R[8] + R[C] sum = Sum + C 
} 


PC 从 50 开 始 , 程序 从 标准 输入 中 读 取 一 系列 数字 ， 计 算 它们 的 总 和 ,然后 
将 结果 写 入 标准 输出 。 该 程序 遵循 约定 ， 纸 带 上 的 0000 标 记 序列 的 结尾 。 









007Dis = 12510 0510 = 129610 


a[0] 
a[1] 
a[2] 
a[3] 
a[4] 
a[5] 
a[6] 
a[7] 
WN aL8] 
“a[9] 
吹 iia[10] 
”length 


TOY 标准 数组 表示 


程序 6.3.4 说 明了 将 纸 带 内 容 加 载 到 数组 中 的 过 程 。 它 被 封装 为 一 个 函数 ， 从 纸 带 中 读 
取 数 组 中 的 字数 量 和 要 存储 的 地 址 ， 然 后 进入 一 个 简单 的 循环 ， 读 取 每 个 字 ， 并 将 结果 存储 
在 a[i] 中 ， 然 后 通过 维护 索引 i 以 跟踪 下 一 个 数组 元 素 的 输入 。 在 读 取 和 存储 了 所 有 内 容 之 
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后 , i 的 值 就 是 数组 的 长 度 一 一 在 停机 指令 前 将 数组 长 度 存 储 在 数组 的 末尾 。 返 回 值 RIA] 中 
保存 的 是 长 度 变量 ， 也 就 是 数组 末尾 一 项 的 地 址 (TOY 标准 格式 )。 






程序 6.3.4 ”数组 处 理 : 读 取 数 组 



















: BAFF RI[A] from stdin a = address of a[0] 
61: 8BFF RI[B] from stdin n = read() 
62: 7101 R[1] <- 0001 
63:” 7900 RI[9] <- 0000 1-=&*0 
64: 22B9 R[2] <- R[B] - R[9] while (i < n) 
65: C26B if (R2 == 0) PC <- 6B { 






66: 1CA9 RI[C] <- R[A] + R[9] 
67: 8DFF R[D] from stdin 








68: BDOC M[R[C]] <- R[D] a[i] = read() 

69: 1991 RI[9] <- R[9] + 1 和 

6A: C064 PC <- 64 } 

6B: 1AA9 RI[A] <- RI[A] + R[9] address of a[] (TOY standard) 
6C: BBOA M[R[A]] <- R[B] a.length = n 








PC <- R[F] return 








PC 从 60 开 始 ， 该 程序 用 于 从 打 孔 纸 带 读 取 一 个 数组 ， 并 以 TOY 标 准 格 式 存 
储 。 具 体 地 说 ， 它 从 标准 输入 中 读 取 地 址 a 和 整数 mn， 并 从 标准 输入 中 读 取 n 个 整 
数 ， 并 将 其 存储 在 存储 位 置 M[a]，M[a+1]，…， M[a+n-1] 中 。 然 后 它 将 n 存 储 
在 M[atn] 中 (并 返回 R[a] 中 的 a+n ) 。 










REA] ~ 008B 





FF60 的 结果 





一 旦 数据 被 加 载 到 一 个 TOY 数组 中 ,数组 处 理 代 码 可 以 精确 地 引用 数组 中 的 第 i 个 元 
素 ; 如 程序 6.3.4 中 的 指令 66 和 68 所 示 : 将 索引 i 与 af0] 的 地 址 相 加 ， 然 后 使 用 间接 访问 
指令 加 载 或 存储 数组 元 素 。 另 一 种 方法 是 维护 一 个 指向 a[ 的 指针 ， 然 后 递增 该 索引 以 移动 
到 下 一 个 元 素 ， 再 次 使 用 间接 访问 指令 访问 数组 元 素 。 

下 面 表格 中 给 出 了 两 个 代码 示例 ， 说 明了 将 数组 作为 参数 传递 给 函数 的 效用 。 表 中 的 第 
一 个 例子 是 一 个 典型 的 数组 处 理 程 序 ， 它 的 功能 是 在 数组 中 寻找 最 大 值 ， 其 中 数组 地 址 保存 
在 R[A] 中 。 它 通过 数组 索引 的 迭代 来 逐个 访问 R[A] 指向 的 数组 中 的 元 素 , 使 用 间接 指令 
加 载 每 个 元 素 ， 并 将 其 与 目前 为 止 所 见 的 最 大 值 进 行 比 较 ， 如 有 必要 ， 更 新 该 值 。 第 二 个 例 
子 是 一 个 客户 程序 ， 从 打 筷 的 纸 带 读 取 数 组 ， 查 找 数组 中 的 最 大 元 素 ， 并 打印 出 最 大 值 。 构 
建 一 套 支 持 各 种 数组 处 理 的 函数 并 不 是 一 件 困 难 的 事情 。 
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实际 上 ,最 初 开发 纸 带 这 样 的 介质 的 动机 之 一 是 在 各 种 应 用 中 保存 由 实验 测量 装置 产生 
的 数据 。 数 据 处 理 (data processing) 的 想法 一 一 在 打 孔 卡片 或 打 孔 纸 带 等 物理 介质 上 存储 数 
据 ， 然 后 用 某 种 机 器 处 理 数据 一 一 早 在 计算 机 出 现 几 十 年 前 就 一 直 是 这 样 的 形式 。 早 在 20 
世纪 初 ， 企 业 就 使 用 打 孔 的 卡片 来 存储 客户 数据 ， 并 于 1901 年 开发 出 一 种 机 器 来 对 打 孔 卡 
片 进行 分 类 (需要 一 些 人 工 干预 )。 的 确 ， 当 今 最 成 功 的 计算 机 公司 之 一 IBM ( International 
Business Machines)， 在 20 世纪 50 年 代 推 出 第 一 台 计 算 机 之 前 就 花 了 半 个 世纪 的 时 间 用 于 
开发 这 种 卡片 分 类 器 。 

不 难 想象 ， 即 便 在 一 个 不 比 TOY 更 复杂 的 计算 设备 上 做 这 些 计算 ， 也 会 对 使 用 计算 尺 上 





和 计算 器 的 世界 产生 深远 影响 。 940 
R[A] <- array address (TOY standard) 
70: 7101 RI[1] <- 0001 
71: A90A R[9] <- M[R[A]] int i = a.length 
72: 140A R[4] <- R[A] 
73: 7B00 RI[B] <- 0 int max = 0 
TA “CII “EE CR[9] - = 0) PC <- 7C while (i > 0) 
用 来 查找 最 75: 2991 RI[9] < R[9] -1 (ia 2 
夫 值 的 函数 ”| 76: 2441 R[4] <- R[4] - 1 addr. of a[7] 
77: ACO04 - R[C] <- M[R4] d= arij] 
78: 2EBC RI[E] <- R[B] - RI[C] 
79: -DE7B if (RIE] > 0) PE <-= 7B if (d > max) 
7A: 1BOC RI[B] <- RI[C] max = d 
7B: C074 PC <- 74 } 
7C: EFO0 PC <- R[F]J return (max in R[BJ]) 
人 Sze 5C: FF60 R[F] <- 5D; PC <- 60 read a[] from stdin 
读 取 数组 并 输出 | 5D: FF70 R[F] <- 5E; PC <- 70 R[B] = maxCa[]) 
最 大 值 (使 用 程序 | 5E: 9BFF R[B] to stdout write result 
5.3.5 和 上 面 的 函数 ) 5F: 0000 halt 941 
| a 
典型 的 数组 处 理 代码 


链接 结构 ”我 们 学 习 过 的 其 他 数据 结构 在 TOY 中 也 并 不 是 很 难 实现 。 例 如 ， 我 们 分 析 
二 又 搜索 树 ( BST， 见 程序 4.4.3 ) 的 实现 过 程 。 为 了 简单 起 见 ， 我 们 假设 构建 的 BST 的 键 
值 都 是 整数 ， 如 下 图 所 示 。 


\ 


二 纯 号 ] [Ging] [720F 
一 组 整数 构成 的 一 个 BST 


我 们 假想 一 个 客户 程序 ， 这 个 程序 可 以 为 输入 的 打 孔 纸 带 实现 数据 去 重 ， 也 就 是 生成 一 
个 删除 了 所 有 重复 值 的 新 纸 带 。 为 了 执行 这 个 任务 ， 我 们 每 读 取 一 个 新 的 值 ， 就 在 BST 中 搜 
索 它 是 否 已 经 存在 ， 若 没有 ， 则 将 它 插入 BST 中 ， 并 写 在 标准 输出 上 。 程序 6.3.5 给 出 了 一 个 
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针对 这 一 功能 的 TOY 函数 实现 。 我 们 首先 来 分 析 这 个 函数 ， 然 后 分 析 数 据 去 重 的 客户 程序 。 
根 为 了 表示 BST 节点 (node)， 我 们 使 用 三 个 TOY 字 : 一 个 用 于 键 值 ， 
一 个 用 于 左 子 树 的 链接 ， 一 个 用 于 右 子 树 的 链接 ，0000 代表 空 链接 。 通 


















2 上 和 | 和 常情 况 下 ， 节 点 会 在 内 存 里 连续 保存 ， 当 然 其 他 分 布 方式 也 是 有 可 能 的 。 
Sy os 二 为 了 表示 树 ， 我 们 使 用 一 系列 在 内 存 中 连续 的 节点 ， 如 左 图 所 示 。 
叶 每 次 我 们 需要 一 个 新 的 节点 时 ， 我 们 将 它 添加 到 这 个 序列 的 末尾 。 因 此 ， 
86 |-o000 | ) | 你 会 发 现在 这 个 图 中 ， 所 有 的 链接 都 是 指向 下 方 的 。 
村 上 FF 二 程序 6.3.5 中 的 BST 搜索 和 插入 (search and insert) 函数 有 三 个 参 
B9 数 ，R[A] 保存 BST 的 根 地 址 ，R[B] 中 保存 搜索 关键 字 ，R[E] 中 保存 插 
e 入 的 新 节点 的 地 址 。 如 果树 是 空 的 ， 它 只 是 创建 一 个 新 节点 ， 如 下 一 自 
BC 所 述 。 如 果树 是 非 空 的 ， 则 将 该 键 与 当前 节点 上 的 键 进行 比较 (使 用 间 
9 上 2 | 。/ ， 接 加 载 指令 加 载 该 键 值 )， 如 果 相 等 成功 搜索 )， 
BF [oo00 | / “ 则 在 RI9] 中 返回 一 个 非 零 值 。 如 果 不 是 ， 则 根 B7 [5553 | 刍 
50 3509。 据 需要 遵循 处 理 左 链接 或 右 链接 (再 次 使 用 加 载 B8 | 00cO | 一 左 链接 
cz [Coo00 “间接 指令 来 加 载 链接 ) 并 循环 ,直到 它 找到 一 个 29 反 " 右 链 拉 
942 BST 表示 匹配 的 键 值 或 者 到 达 0000 链接 。 BST 节点 表示 






程序 6.3.5 ”链接 结构 : 在 BST 中 搜索 /插入 


R[1] <- 0001 





















81: A90A R[9] <- root x = root 

82: 180A R[8] <- RI[A] save Tink addr 
83: C98F if (R[9] == 0) PC <- 8F while (x != 0) { 
84: ACO9 R[C] <- M[R[9]] t= x.key 

85: 2CBC RI[C] <- R[B] - R[C] if (t == key) 
86: CC96 if (R[C] == 0) PC <- 96 return 
87: 1991 RI[9] <- R[9] + 1 

88: 1809 R[8] <- R[9] else if (t > key) 
89: A909 R[9] <- M[R[9]] X = x.left 
8A: DC8E if (R[C] > 0) PC <- 8E else 

8B: 1981 R[9] <- R[8] + 1 x = xsright 


8C: 1809 R[8] <- R[9] 

8D: A909 R[9] <- M[R[9]] 

3E: "©0083 FC #5583 } 

8F: BE08 M[R[8]] <- R[E] set Jink to new node 
90: BBOE M[R[E]] <- key 

91: 1EE1 RI[E] <- R[E] + 1 

92: 900E MI[R[E]] <- 0 

93: 1EE1 RI[E] <- R[E] + 1 

94: 900E M[RE] <- 0 new node(key, 0, 0) 
95: 1EEl1 “RI[E] <- R[E] + 1 

PC <- R[F] return 











调用 从 FF80 开 始 ， 这 个 程序 在 以 R[A] 为 根 的 BST 中 搜索 R[B] 给 出 的 键 
值 ， 以 R[E] 中 的 地 址 为 新 节点 分 配 内 存 。 如 果 搜 索 成 功 ， 则 R[9] 中 的 返 
回 值 不 为 零 ， 如 果 搜 索 不 成 功 ( 并 且 添 加 了 一 个 节点 ) ， 则 返回 值 为 零 .时 
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一 旦 确定 搜索 键 值 不 在 树 中 ， 意 味 着 新 的 节点 必须 在 搜索 终止 的 点 处 被 链接 到 树 中 ， 则 
执行 BST 插入 功能 。 完 成 此 任务 的 技巧 是 保存 最 后 一 个 链接 的 地 址 (指令 82、88 和 8C 处 
都 是 保存 在 R[8] 中 )。 当 该 链接 为 0000 时 ， 我 们 可 以 使 用 指令 BE08 来 将 搜索 结束 的 空 链 
接替 换 为 新 节点 的 链接 。 创 建 一 个 新 节点 后 ， 输入 纸 带 
我 们 存储 新 键 值 和 两 个 0000 链接 ， 并 根据 需 
要 更 新 RIE] (这 个 代码 在 指令 90 一 95 中 )， 然 
后 返回 R[9] = 0。 

程序 6.3.5 本 质 上 是 一 个 完整 的 符号 表 实 
现 ， 在 各 种 实际 情况 下 它 可 能 是 快速 和 高 效 
的 。 从 许多 方面 来 说 ， 这 个 实现 都 比 Java 的 
版 本 更 简单 易 懂 。 至 少 ， 这 是 理解 链接 结构 本 
质 的 一 个 非常 有 用 的 方法 。 

程序 6.3.5 中 的 函数 使 我 们 的 打 孔 纸 带 数 
据 去 重 客户 程序 可 以 在 10 条 TOY 指令 之 内 实 
现 ， 如 下 所 示 。 当 你 在 本 章 开 头 读 到 TOY 时 ， 
你 可 能 不 会 想到 它 有 能 力 进 行 这 种 有 用 的 计 
算 。 而 且 ; 当然 ， 这 只 是 一 个 开始 ! 


A0: 7ABO RI[A] <- BO root 

Al: ‘7EB1 {EEI <= B+ free space 

A2: 8BFF R[B] from stdin while ((b = read()) != 0) 
为 一 个 打 孔 A3: CBA8 if (R[B] == 0) PC <- A8 { 

A4: FF80 R[F] <- PC; PC <- 80 x = searchInsert(b) 


03C4 
03C4 
720F 
03C4 
S33 
61A9 
03C4 
5553 ”输出 纸 带 
001B 
IF08 
001B 
001B 
5553 
0000 


03C4 
720F 
5553 
61A9 
001B 
1F08 





纸 带 去 重 -| A5; C9A2 if (R[9] == 0) PC <- A2 if (x == 0) continue 
A6: 9BFF RI[B] to stdout print(b) 
A7: COA2 PC <- A2 } 


A8: 0000 halt 
典型 的 符号 表 客 户 程序 


为 什么 要 学 习 机 器 语言 编程 ? ”现在 你 已 经 基本 了 解 了 机 器 语言 编程 涉及 的 内 容 ， 在 你 
自己 开始 实际 编写 一 些 机 器 语言 程序 之 前 ， 重 新 审视 这 个 问题 很 重要 。 学 习 机 器 语言 编程 主 
要 有 以 下 三 个 基本 原因 

。 机 器 语言 程序 在 应 用 程序 中 仍然 会 经 常用 到 。 

。 在 这 个 最 低级 别 查看 计算 可 以 更 好 地 揭示 其 本 质 。 

。 你 可 以 更 好 地 理解 为 计算 机 创建 机 器 语言 程序 的 程序 ， 比 如 编译 器 等 。 

我 们 将 在 这 里 明确 而 详细 地 描述 这 些 原因 ， 并 总 结 本 章 所 讨论 的 内 容 。 

第 一 ， 机 器 语言 程序 在 关键 性 能 中 仍然 会 经 常用 到 。 科 学 家 、 工 程 师 和 应 用 程序 员 在 不 
断 地 尝试 拓展 人 类 的 计算 能 力 ， 而 且 计 算 的 关键 部 分 的 低级 实现 通常 比 高 级 语言 版 本 要 快 一 
个 或 两 个 数量 级 。 也 许 你 不 会 参与 这 样 的 开发 ， 但 你 至 少 应 该 知道 可 以 这 样 做 。 

第 二 ， 机 器 语言 编程 通常 能 够 捕捉 到 计算 的 本 质 ， 因 为 它 可 以 剥离 程序 对 系统 和 机 器 的 
依赖 ， 直 接 展示 出 计算 操作 的 具体 步骤 。 机 器 语言 程序 中 的 数据 结构 要 比 高 级 语言 中 的 更 为 
透明 。 我 们 刚刚 思考 过 的 BST 就 是 一 个 很 好 的 例子 ， 我 们 还 会 在 练习 中 探索 其 他 例子 。 

第 三 ,一 旦 你 了 解 机 器 语言 ， 就 可 以 考虑 用 Java 这 样 的 高 级 语言 来 编写 可 以 生成 程序 的 
程序 。 无论 何 时 使 用 计算 机 ， 都 依赖 于 这 样 的 程序 ， 因 为 你 的 计算 机 上 运行 的 所 有 内 容 最 终 
都 被 简化 为 机 器 语言 。 我 们 将 在 下 一 节 中 更 详细 地 探讨 编程 的 这 一 要 素 5 编写 程序 并 生成 程 
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序 是 一 个 能 为 你 带 来 成 就 感 的 体验 ,每 个 人 都 可 以 尝试 一 下 。 

在 本 书 中 ,我 们 的 目的 是 通过 描述 硬件 和 软件 之 间接 口 的 性 质 ， 来 揭示 计算 机 内 部 发 生 
的 事情 。 我 们 希望 你 能 把 TOY 编程 视 为 一 个 了 解 这 些 重要 概念 的 窗口 ， 而 不 必 应 付 真 实 世 
界 的 计算 机 ， 因 为 它们 太 过 复杂 。 机 器 语言 编程 可 以 使 我 们 可 以 了 解 很 多 的 基本 概念 。 或 者 
也 可 以 将 TOY 视 作 学 习 更 复杂 的 计算 机 的 必要 准备 。 

本 书 之 所 以 讲解 机 器 语言 编程 ， 是 因为 它 提供 了 Java 程序 和 计算 机 之 间 的 中 间 抽 象 层 
次 ， 虽 然 过 去 几 十 年 来 计算 基础 设施 的 发 展 非常 迅速 ， 但 是 这 种 抽象 结构 没有 发 生变 化 。 经 
过 本 章 的 学 习 ， 首 先 ， 现 在 你 可 以 更 好 地 理解 编写 的 Java 程序 与 计算 机 实际 执行 的 机 器 语 
言 程序 之 间 的 关系 。 下 一 节 将 更 详细 地 探讨 这 种 关系 。 其 次 ， 为 后 续 的 学 习 做 好 准备 ， 你 现 
在 可 以 开始 想象 如 何 创建 物理 器 件 以 执行 这 些 机 器 语言 程序 。 在 第 7 章 中 ， 我 们 会 设计 和 构 
建 可 执行 机 器 语言 程序 的 电路 ， 从 而 彻底 揭 开 计算 机 的 神秘 面纱 。 熟 悉 像 TOY 这 样 的 低级 
机 器 对 于 理解 电路 如 何 工 作 起 着 至 关 重要 的 作用 。 


问答 环节 


问 : 我 真 的 需要 练习 写 TOY 程序 吗 ? 

答 : 是 的 ， 你 可 能 不 需要 像 你 在 Java 中 编程 做 到 的 那样 ， 但 你 必须 理解 TOY 是 另 一 种 
编程 语言 。 当 然 ， 了 解 Java 可 以 让 你 更 容易 学 习 TOY， 而 且 你 将 会 看 到 每 一 门 学 到 的 语言 
都 可 以 让 你 在 学 习 下 一 个 语言 时 更 加 容易 。 

问 : 我 在 哪里 可 以 找到 关于 TOY 的 更 多 信息 ? 

答 : 在 过 去 的 二 十 年 里 ,我 们 的 学 生 、 助 教 、 学 科 相 关 教 师 在 编写 本 书 时 开发 了 大 量 的 
相关 信息 ， 可 以 在 本 书 网 站 中 找到 。 特 别 是 如 果 你 有 兴趣 ， 可 以 找到 一 个 交互 式 的 TOY 模 
拟 器 ， 并 练习 用 开关 和 灯 自 行 输入 程序 。( 我 们 用 它 来 做 教学 演示 。) 

问 : 是 否 还 有 有 关 TOY 的 其 他 信息 来 源 ? 

答 : 没有 ， 一 点 也 没有 。 因 为 这 是 一 个 虚构 的 机 器 。 

问 : 我 是 不 是 应 该 学 习 一 些 其 他 的 机 器 语言 ? 

答 : 当然 ， 你 可 以 在 真 机 上 学 习 编 程 。 正 如 文中 所 提 到 的 ， 认 识 TOY 是 为 学 习 真 正 的 
机 器 语言 做 更 充足 的 准备 。 你 可 能 想 了 解 广泛 使 用 的 IA-32 体系 结构 ;但 请 注意 ， 完 整 的 软 
件 开 发 人 员 手 册 长 达 数 千 页 ! 

答 : 或 者 ， 你 也 可 以 学 习 MIX， 这 是 D. E. Knuth 为 他 的 经 典 系列 书籍 《计算 机 编程 的 
艺术 》(The Art of Computer Programming) 开发 的 另 一 种 假想 的 机 器 语言 。 你 可 以 在 这 套 书 
的 前 言 中 阅读 他 选择 机 器 语言 的 原因 ; 其 中 之 一 是 :“ 一 个 对 计算 机 感 兴趣 的 人 应 该 很 好 地 
学 习 使 用 机 器 语言 ， 因 为 它 是 计算 机 的 基础 部 分 。” 如 果 你 学 习 了 MIX， 在 Knuth 的 书 中 你 
可 以 读 到 大 量 只 在 MIX 中 表达 的 算法 。 


练习 


重要 提示 。 如 果 你 能 够 有 一 台 TOY 机 器 来 运行 和 调试 程序 ， 那 么 这 些 练习 要 简单 得 
多 ， 所 以 建议 你 先 学 习 6.4 节 的 内 容 ， 然 后 再 回来 做 这 些 练习 。 
6.3.1 “编写 一 个 程序 sort3.toy， 它 从 标准 输入 中 读 和 三 个 整数 ， 并 按 升序 将 其 打印 到 标准 输出 。 
6.3.2 “编写 一 个 程序 powers2.toy， 在 标准 输出 上 打 孔 表示 出 2 的 所 有 正 整 数 次 短 ， 注 意 不 要 超过 一 个 
TOY 字 补 码 的 表示 范围 。 
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6.3.3 “编写 一 个 程序 sum_1-n.toy， 从 标准 输入 中 读 入 整数 n， 并 打印 出 1+2+3+…+nn 的 计算 结果 。 

6.3.4 ”给 定 一 个 整数 x， 根 据 克拉 茨 序列 〈collatz sequence)， 其 下 一 个 整数 的 定义 是 : 如 果 x 是 偶数 ， 
则 计算 x/2 ; 如 果 x 是 奇数 ， 则 计算 3x + 1， 一直 循环 计算 ， 直 到 x 为 1 ( 见 练习 2.3.29 )。 编 
写 一 个 程序 collatz.toy， 它 从 标准 输入 中 读 取 一 个 整数 ， 并 将 它 的 克拉 茨 序 列 打 印 到 标准 输出 。 
提示 : 使 用 右 移 指令 进行 整数 的 除 2 操作 。 

6.3.5 ”参考 文中 针对 过 和 while 绘制 的 图 表 ， 绘 制 一 个 图 表 以 展示 如 何在 TOY 中 实现 for 循环 。 

6.3.6 ”编写 程序 chop.toy， 从 标准 输入 中 读 入 一 个 整数 n， 并 将 n 分 解 为 一 系列 2 的 寡 数 的 和 ， 输 出 
这 些 2 的 寡 数 。 例 如 ， 如 果 nm 是 012A， 那么 程序 应 该 在 纸 带 上 打 孔 输出 


0002 
0008 
0020 
0100 


因为 012A = 0002 + 0008 + 0020 + 0100。 

6.3.7 ”编写 一 个 程序 ， 从 标准 输入 中 读 人 一 个 整数 ， 求 它 的 三 次 寡 ， 然 后 打印 出 结果 。 对 于 乘法 ， 使 
用 FF90 调用 练习 6.3.35 中 给 出 的 乘法 函数 。 

6.3.8 ”编写 一 个 TOY 代码 片段 ， 用 于 交换 R[A] 和 R[B] 的 内 容 ， 不 写 人 主 存储 器 ， 也 不 能 写 人 任何 


其 他 寄存 器 。 提 示 : 使 用 xor 指令 。 948 
6.3.9 ”本题 测试 加 载 地 址 、 加 载 和 间接 加 载 之 间 的 差异 。 对 于 以 下 每 个 TOY 程序 ， 终 止 时 给 出 R[1]、 
R[2] 和 R[3] 的 内 容 。 
(a) 10: 7211 (b) 10: 8211 (c) 10: 7211 
11: 7110 11: 8110 11: A102 
12: 2321 12: 2312 12: 2312 
13: 0000 13: 0000 13: 0000 
6.3.10 分析 以 下 TOY 程序 。 当 停机 时 ，R[3] 的 值 是 多 少 ? 
10: 7101 
11: 7207 
12: 7301 
13: 1333 
14: 2221 
15: D213 
16: 0000 


6.3.11 对 于 以 下 每 个 布尔 表达 式 ， 给 出 一 个 TOY 代码 片段 ， 它 从 标准 输入 中 读 取 一 个 整数 a， 如 果 
对 应 的 条 件 为 真 ， 则 将 0001 写 到 标准 输出 ; 如 果 为 false， 则 将 0000 写 到 标准 输出 。 


= 3 
a>3 
- 
a le 3 
a >= 3 
a <= 8 


6.3.12 ”假设 你 将 以 下 内 容 加 载 到 TOY 的 内 存 中 10 一 17 的 位 置 ， 将 PC 设置 为 10， 然 后 按 下 RUN 键 。 


10: 7100 RI[1] <- 0000 

11: 8FFF R[F] from stdin 
12: 9F15  M[15] <- R[F] 

13: 82FF R[2] from stdin 
14: 1112  R[1] = R[1] + R[2] 
15: C016 “PC <- 16 

16: 91FF RI[1] to stdout 

17: 0000 halt 
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6.3.13 
6.3.14 


6.3.15 


6.3.16 


6.3.17 


6.3.18 


6.3.19 


名 6 但 


如 果 标 准 输入 是 “1112 1112”， 标 准 输出 是 否 会 产生 输出 信息 ? 如 果 有 的 话 ， 输 出 是 什么 ? 
提示 : 第 一 个 值 存 储 在 M[15] 中 ， 最 终 被 作为 代码 执行 。 

将 标准 输入 替换 为 C011 C011 1112 1112， 重 新 回答 上 一 个 问题 。 

写 一 个 TOY 函数 ， 以 a、b 和 c 为 参数 ， 分 别 存储 在 RIA]、R[B] 和 R[C] 中 ， 计 算 判别 式 4 = 
b”-4ac， 返 回 的 结果 放 在 R[d] 中 。 把 你 的 代码 入 口 放 在 内 存 中 10 的 位 置 ， 用 FF90 调用 练习 
6.3.35 给 出 的 乘法 函数 。 

对 于 以 下 程序 ,分析 哪些 输入 值 能 够 让 程序 在 停机 前 将 0001 写 人 标准 输出 。 列 出 处 于 0123 
和 3210 之 间 的 输入 值 。 


10: 8AFF R[A] from stdin 

11: 7101 R[1] <- 0001 

12: 2BAL R[B] <- R[A] - 1 
13: 3CAB  R[C] <- R[A] & RI[B] 
14: 9CFF RI[C] to stdout 

15: 0000 halt 


答案 : 0200 0400 0800 1000 2000。 土 面 这 段 程序 对 于 三 进 制 表示 法 中 至 多 只 有 一 位 1 的 整数 
会 返回 1， 即 十 六 进 制 表示 的 0000, 0001, 0002, 0004, 0008, 0010,…, 8000。 
假设 你 将 下 面 的 程序 加 载 到 TOY 的 内 存 中 10 一 20 位 置 : 


0 IO 
11: 7A30 
12: 7B08 
13: 130B 
14: C320 
15: 1400 
16: 2543 
EE 
18: 16A4 
19: A706 
3A:s1717 
1B: B706 
1C: 1414 
1D: C016 
TY 5331 
IF: C014 
20: 0000 


现在 假设 将 0001 0002 0003 0004 0004 0003 0002 0001 加 载 到 内 存 位 置 30 一 37， 将 PC 设置 为 
10， 然 后 按 RUN 键 。 当 程序 停止 时 ， 内 存 位 置 30 一 37 的 内 容 是 什么 ? 
填写 “????”,， 将 上 一 个 练习 中 的 TOY 程序 翻译 成 Java 代码 。 


for Gintot Eve 723720s70I mt ?77 
for Cint. 4 nm DT.< T2271 和 二 中 32222293 


假设 将 两 个 向 量 存储 在 TOY 数组 中 ， 编 写 一 个 程序 计算 这 两 个 向 量 的 点 积 。 构 建 一 个 函数 ， 
它 从 R[A] 和 R[B] 中 获取 数组 的 地 址 ， 并 将 点 积 的 结果 放 在 RIE] 中 返回 。 使 用 FF90 调用 练 
习 6.3.35 中 给 出 的 乘法 函数 。 注 意 : 你 需要 处 理 一 个 我 们 到 目前 还 未 处 理 过 的 更 普遍 的 函数 
调用 约束 。 你 需要 在 函数 调用 的 前 后 保存 并 恢复 寄存 器 R[F] 中 保存 的 返回 地 址 ， 以 便 在 调用 
乘法 函数 时 可 以 使 用 相同 的 寄存 器 作为 返回 地 址 。 见 练习 6.3.27。 

假设 将 以 下 程序 加 载 到 TOY 的 内 存 位 置 10 一 1B ， 并 且 标 准 输入 的 值 为 1CAB EF00 0000 4321 
1234。 当 将 PC 设置 为 10 并 按 下 RUN 时 ， 将 会 在 标准 输出 上 打印 出 什么 值 ? 


6.3.20 
6.3.21 


6.3.22 


6.3.23 


6.3.24 
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10: 7101  R[1] <- 0001 

11: 7230 R[2] <- 0030 

12: 8AFF RI[A] from stdin 

13; CAl17,- ,if (REA] == 0) PG. <- :17 
14: BA02 M[R[2]] <- RI[A] 

15: 1221 R[2] <- R[2] + 1 

16: C012 PC, <- 12 

17: 8AFF RI[A] from stdin 

18: 8BFF RI[B] from stdin 

19: FF30 see previous exercise 
1A: 9CFF RI[C] to stdout 

1B: 0000 halt 


当 标准 输入 的 值 为 2CAB EF00 0000 4321 1234 时 ， 上 述 练习 会 得 到 什么 结果 。 
考虑 下 面 遍历 链表 的 代码 : 


10: 7101 
11: 72D0 


每 个 节点 在 内 存 中 占据 两 个 连续 字 长 ， 一 个 值 后 跟 一 个 链接 (下 一 个 节点 的 地 址 )， 链 接 值 
0000 表示 该 列表 的 结尾 。 假 设 内 存 位 置 D0 一 DB 存储 了 这 些 值 : 


0001 00D6 0000 0000 0004 0000 0002 00DA 0000 0000 0003 00D4 


给 出 该 程序 打印 出 的 值 (将 PC 设置 为 10， 然 后 按 下 RUN 键 )。 

答案 : 1 2 3 4。 

指出 如 何 通过 更 改 上 一 练习 中 的 一 个 内 存 字 ， 以 便 打 印 “1 2 6 7” 而 不 是 “1 23456 7”( 链 
表 删 除 )。 

指定 如 何 更 改 三 个 内 存 字 (修改 一 个 ， 增 加 两 个 )， 使 练习 6.3.21 中 的 程序 打印 “1 23 48 5 6 
7” (链表 插入 )。 

假设 TOY 存储 器 保存 了 以 下 值 ， 将 程序 计数 器 设置 为 30 并 按 下 RUN 键 。 标 准 输出 上 是 否 会 
打印 信息 ?如 果 有 的 话 ， 信 息 是 什么 ? 当 机 器 停机 时 ， 列 出 R[2] 和 R[3] 的 内 容 。 


3 4_ bi 6_ 
0000 7101 7101 0003 0002 
0000 7200 7200 0000 0050 
0000 8329 8329 0005 0000 
0000 1221 A403 0000 0000 
0000 1331 1224 0004 0000 
0000 A303 1331 0052 0000 
0000 D333 A303 0000 0000 
0000 92FF D343 0000 0000 
0000 0000 0000 0001 0000 
005A 0000 0000 0060 0000 
0000 0000 0000 0000 0000 
0000 0000 0000 0058 0000 
0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 
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6.3.25 


6.3.26 
6.3.27 


6.3.28 


锚 6 茧 


开发 一 对 实现 下 推 栈 的 TOY 函数 ，R[A] 保存 栈 的 地 址 ，R[B] 保存 向 栈 中 推 人 或 从 栈 中 弹出 
的 值 。 

编写 一 个 遍历 BST 的 TOY 函数 ， 并 按照 排序 输出 得 到 的 键 值 。 提 示 : 使 用 下 推 堆 栈 。 

使 用 练习 6.3.25 中 的 解决 方案 来 开发 两 个 TOY 函数 : 一 个 将 R[A] 到 R[F] 的 寄存 器 保存 在 堆 
栈 中 ， 另 一 个 从 堆栈 中 依次 恢复 相应 寄存 器 的 值 。 使 用 这 些 函 数 来 开发 一 个 递归 程序 ， 以 在 
输出 纸 带 上 打印 出 类 似 标尺 功能 的 线条 。 

改进 我 们 已 经 实现 的 BST 函数 (程序 6.3.5 )， 通 过 将 每 个 节点 的 两 个 链接 打包 成 一 个 内 存 字 来 
节省 空间 。 


创新 练习 


6.3.29 


6.3.30 


G331 
6332 


6.3.33 


6.3.34 


6.3.35 


32 位 整数 。 写 一 个 TOY 函数 ,将 R[A] 和 了 R[B] 连接 在 一 起 看 作 一 个 32 位 二 进 制 补 码 整数 ， 
R[C] 和 R[D] 连接 在 一 起 视 作 第 二 个 32 位 二 进 制 补 码 整 数 ， 将 两 者 相 加 ， 结 果 保 留 在 R[A] 
和 R[B] 中 。 
格雷 码 。 编 写 一 个 TOY 程序 graycode.toy， 它 从 标准 输入 中 读 入 一 个 整数 n (1 到 15 之 间 )， 
然后 假设 有 变量 i 从 2” = 1 开始 递减 到 0， 打 印 (i >> 1)^i 到 标准 输出 。 这 样 得 到 的 输出 序 
列 称 为 n 阶 格雷 码 。 参 见 程 序 2.3.3 相关 的 讨论 。 
点 积 。 计 算 两 个 数组 的 点 积 ， 它 们 的 起 始 位 置 为 R[A] 和 RI[B]， 长 度 为 R[C]。 
Axpy。 编 写 一 个 TOY 函数 ， 该 函数 需要 输入 一 个 标量 a 和 一 个 向 量 b5p， 其 中 标量 a 保存 在 
R[A] 中 ,向 量 5 保 存在 一 个 TOY 数组 中 ， 数 组 地 址 保存 在 R[B] 中 ， 函 数 返 回 另 一 个 向 量 c， 
保存 c 的 TOY 数组 地 址 保存 在 RI[C] 中 ; 计算 向 量 ab+c; 并 将 结果 留 在 一 个 TOY 数组 中 ， 并 
在 R[D] 中 保存 这 个 数组 的 地 址 。 
一 次 性 密码 本 。 在 TOY 中 实现 一 次 性 密码 本 的 功能 ， 用 以 加 密 和 解密 256 位 消息 。 假 定 密 钥 
被 存储 在 存储 器 位 置 30 一 3F 中 ， 输 入 数据 由 16 个 16 位 整数 组 成 。 
找到 不 同 的 数 。 假设 在 标准 输入 上 输入 了 2n + 1 个 16 位 整数 的 序列 ， 其 中 个 整数 出 现 且 仅 
出 现 两 次 ， 仅 有 一 个 整数 只 出 现 一 次 。 编 写 一 个 TOY 程序 来 找 出 这 个 数 。 提 示 : 将 所 有 的 整 
数 进行 异 或 。 
有 效 的 乘法 。 实 现 你 在 小 学 时 学 过 的 算法 ， 把 两 个 整数 相 乘 。 具 体 来 说 ， 让 bi 表示 4b 的 第 i 
位 ， 这样: 
b=(bis x 2°5)+ (bi x 2")+: +(b: x 2')+(bo x 2°) 

现在 ， 要 计算 a x bp， 使 用 分 配 定律 : 

a x b=(a x bis x 25)+(a x bi x 2 )+:"…+(a x bi x 2')+(a x bo x 2") 
你 很 自然 地 会 想 ， 这 似乎 将 一 次 乘法 操作 变 成 了 32 次 乘法 操作 ， 对 于 16 位 中 的 每 一 位 做 两 
次 。 幸 运 的 是 ， 这 32 个 乘法 中 的 每 一 个 都 是 一 个 非常 特殊 的 类 型 ， 因 为 ax2i 与 a 左 移 i 位 
相同 。 由 于 bi; 是 0 或 1， 因 此 第 i 项 是 a<<i 或 者 是 0。 


答案 : 

90: 7101  R[1] <- 0001 

91: 7C00  R[C] <- 0000 c=0 

92: 7210 “R[2] <- 0010 for (ji 16Y >0)i-9 
93: 2221 RL[2] <- R[2] - 1 { 

94: 53A2  R[3] <- R[A] << R[2] ta dr A 


95: 64B2  R[4] <- R[B] >> R[2] 
96: 3441  R[4] <- R[4] & 1 
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97: C41B if (R[4] == 0) PC <- 99 if b[i] == 
838 1CC3 R[C] <- R[C] + RL[3] C += 七 
99: D293 if (R[2] == 0) PC <- 93 } 
9A: FF00 return 

6.3.36 各 画 数 。 使 用 上 一 个 练习 的 乘法 函数 ， 实 现 一 个 计算 a* 的 TOY 函数 ， 参 数 a 和 4。 的 值 分 别 存 
在 R[A] 和 R[B] 中 。 

6.3.37 多项式 求 值 。 使 用 前 面 两 个 练习 的 罕 函 数 和 乘法 函数 ， 实 现 一 个 TOY 函数， 该 TOY 函数 使 
用 一 个 TOY 数组 保存 系数 a。、al!、a;、…、a,， 用 一 个 整数 表示 自 变 量 x， 其 中 数组 的 地 址 保 
存在 RE[A] 中 ,x 的 值 保存 在 R[B] 中 。 计 算 以 下 多 项 式 : 

p(X) = aa’ + + qx + ayx! + aox’ 
将 结果 保存 在 RIC] 中 并 返回 。 多 项 式 求 值 是 早期 计算 机 (准备 弹道 表 ) 解决 的 主要 问题 之 一 。 

6.3.38 ”塞纳 方法 是 解决 多 项 式 求 值 问题 时 比 直接 求 值 更 高 效 、 更 容易 编码 的 一 种 巧妙 的 方法 。 这 个 
方法 的 基本 思想 是 合理 地 排列 乘法 的 组 合 方式 ， 如 下 例 所 示 : 

Paxr +p3x +p2x +pix +pox =((((pa)x + pa3)x + pa)x + pi)x +po 
基于 这 个 想法 实现 一 个 TOY 函数 ， 只 使 用 nn 次 乘法 来 为 一 个 n 阶 多 项 式 求 值 。 这 种 方法 是 
在 19 世纪 由 英国 数学 家 威廉 . 霍 纳 (William Horner) 发 表 的 ， 但 在 此 之 前 的 一 个 多 世纪 艾 萨 
克 . 牛顿 (Isaac Newton) 就 在 使 用 它 了 ( 见 练习 2.1.31 )。 

6.3.39 号码 转 换 。 实 现 一 个 使 用 霍 纳 方法 的 TOY 程序 (参见 程序 6.1.1 )， 它 将 十 进 制 整数 转换 为 二 
进 制 表 示 。 从 标准 输入 中 以 十 六 进 制 的 形式 (格式 为 000x) 读 取 一 个 十 进 制 整数 ， 然 后 在 标 
准 输出 上 打印 出 它 的 二 进 制 编码 ， 一 次 打印 一 位 。 


6.4 TOY 虚拟 机 


考虑 到 TOY 是 一 个 虚拟 机 ， 我 们 如 何 能 够 运行 和 调试 程序 呢 ? 在 本 节 中 ， 我 们 将 为 这 
个 问题 提供 一 个 完整 的 答案 ， 然 后 讨论 其 意义 。 在 本 节 中 你 将 看 到 ， 我 们 可 以 轻松 地 编写 一 
个 称 为 虚拟 机 的 Java 程序 ， 它 可 以 运行 任何 TOY 程序 。 事 实 上 ， 正 如 你 所 看 到 的 ， 虚 拟 机 
定义 了 TOY 的 实现 方式 ， 它 精确 地 描述 了 每 个 TOY 指令 的 效果 ， 并 且 始 终 保 存 着 TOY 机 
器 的 完整 的 状态 信息 。 

虚拟 机 定义 的 是 这 样 的 一 种 机 器 : 它 像 真 机 一 样 执行 程序 ， 但 不 需要 与 任何 物理 硬件 直 
接 对 应 。 通 常 我 们 使 用 这 个 术语 来 宽泛 地 指 代 机 器 以 及 实现 它 的 软件 (或 硬件 )。 

虚拟 机 的 概念 在 一 开始 或 许 会 令 人 不 太 适 应 ， 为 确保 读者 能 够 完全 理解 这 一 概念 ， 我 们 
会 完整 地 讲述 这 一 概念 的 所 有 细节 ， 而 虚拟 机 的 概念 也 是 第 5 章 中 讨论 的 计算 理论 基本 思想 
的 核心 。 事 实 上 ， 邱 奇 - 图 灵 理 论 意味 着 任何 计算 系统 都 可 以 执行 相同 的 计算 ， 只 要 内 存 足 
够 大 ;因此 每 台 计 算 机 都 可 以 视 作 其 他 计算 机 的 虚拟 机 。 

虚拟 机 的 核心 概念 是 处 理 程序 的 程序 。 你 可 能 还 记得 ， 在 停机 问题 的 证 明 中 ， 我 们 引 
入 了 一 个 想法 ， 即 一 个 程序 可 以 将 另 一 个 程序 作为 输入 。 这 个 想法 起 初 似乎 有 点 奇怪 ， 实 际 
上 ， 这 个 想法 是 一 个 基本 的 计算 机 科学 概念 ， 我 们 将 在 本 节 中 详细 探讨 。 

作为 热身 ， 我 们 讨论 一 些 简单 的 TOY 编程 概念 的 实际 应 用 ， 其 中 包括 一 个 重要 的 和 难 
以 避免 的 常见 问题 。 我 们 会 讨论 这 些 问 题 与 Java 存在 很 多 相似 与 关联 ， 进 而 开始 讨论 本 节 
的 核心 部 分 TOY 虚拟 机 。 最 后 我 们 讨论 这 一 模型 对 现代 和 未 来 计算 机 的 影响 。 

本 节 涵 盖 了 很 多 方面 的 内 容 ， 从 TOY 到 停机 问题 ， 再 到 服务 器 农场 和 云 计算 ， 接 下 
来 我 们 将 会 揭示 这 些 概念 和 术语 背后 的 深层 含义 ， 并 诠释 它 的 能 力 、 简 洁 以 及 重要 性 。 篇 
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幅 所 限 ， 我 们 无 法 对 它们 进行 详尽 的 解释 ， 但 对 于 从 事 计算 的 人 来 说 ， 理 解 这 些 术 语 非常 
重要 。 

启动 和 导出 ”首先 我 们 来 研究 所 有 类 似 TOY 的 冯 . 诺 依 曼 机 器 都 具有 的 本 质 特征 一 一 
它 可 以 处 理 任何 类 型 的 数据 ， 而 不 仅仅 是 数字 。 事 实 上 ， 一 个 程序 的 
指令 可 以 是 另 一 个 程序 的 数据 。 具 体 来 说 ， 我 们 来 分 析 TOY 编程 环 
境 中 这 个 属性 的 两 个 实际 结果 。 

启动 。 思 考 右 图 所 示 的 打 孔 纸 带 ， 看 起 来 很 熟悉 吗 ? 在 运行 时 ， 
可 能 会 将 这 些 4 位 十 六 进 制 数字 中 的 一 部 分 识别 为 TOY 指令 。 实 际 
上 ， 我 们 之 前 已 经 看 到 过 它们 一 一 它们 是 程序 6.3.3 (计算 输入 纸 带 上 
数字 的 总 和 ) 的 指令 序列 ， 在 最 前 面 的 是 第 一 个 指令 的 地 址 和 指令 的 
数量 。 但 是 ， 正 如 我 们 从 本 章 开 始 就 强调 的 那样 ， 计 算 机 内 给 定 二 进 
制 序列 的 含义 取决 于 上 下 文 。 因 此 ， 程 序 也 可 以 将 这 些 数据 解读 为 二 
进 制 补 码 。 事 实 上 ， 这 个 纸 带 也 可 以 作为 程序 6.3.3 的 输入 来 计算 其 。 输入 数据 (? ) 
总 和 : 

S01i6t+ 716t+ 780016 + (—730116) + (-33AB16) + 18CCie + (-3FAF1¢) + (-630116) 

更 重要 的 是 ， 这 个 纸 带 也 可 以 作为 读 取 数组 程序 (程序 6.3.4 ) 的 输入 一 一 我 们 认为 纸 
带 是 一 个 程序 ， 并 把 程序 6.3.4 当 作 一 个 将 其 他 程序 加 载 到 内 存 的 程序 。 事 实 上 ， 我 们 可 以 
为 我 们 设计 过 的 每 个 TOY 程序 制作 纸 带 ， 并 以 这 种 方式 将 它们 加 载 到 内 存 中 。 

又 或 者 ,我 们 可 以 为 10~FF 之 间 的 所 有 内 存 位 置 设置 一 个 纸 带 ， 并 用 我 们 的 代码 和 数 
据 填 充 整个 内 存 。 这 个 过 程 被 称 为 启动 计算 机 一 一 这 个 术语 一 直 使 用 到 现在 。 我 们 使 用 某 个 
特殊 的 方法 (在 TOY 中 是 开关 ) 将 一 段 小 程序 加 载 到 内 存 中 ， 然 后 它 可 以 区 外 部 设备 加 载 
内 存 的 其 余部 分 。 

在 下 面 “启动 和 导出 ”的 表格 的 左边 是 从 程序 6.3.4 获得 的 代码 ， 我 们 对 它 做 了 一 些 简 
单 修改 ， 从 一 个 函数 变 为 一 段 启动 代码 ( boot code)。 它 会 在 计算 机 加 电 的 最 开始 ， 由 程序 
员 通 过 开关 输入 到 计算 机 中 ， 并 成 为 计算 机 运行 的 第 一 段 代码 。 在 计算 机 的 发 展 历程 中 ， 典 
型 的 做 法 是 预 留 内 存 的 最 前 面 几 个 字 (在 我 们 的 例子 中 为 00~0F) 用 作 启 动 程序 。 像 TOY 
这 样 的 计算 机 通常 都 会 在 前 面 的 控制 板 上 写 上 一 段 这 样 的 程序 ， 因 为 这 将 是 唯一 需要 通过 开 
关 进 入 的 程序 。 程 序 员 需 要 通过 拨 动 开关 加 载 这 段 程序 ， 他 们 让 手指 像 钢 琴 演奏 家 一 样 (好 
吧 ， 不 完全 是 ) 在 开关 上 滑动 ， 并 以 这 样 的 输入 速度 引 以 为 做 。 

除了 不 作为 函数 打包 之 外 ， 启 动 程序 与 程序 6.3.4 有 两 个 不 同 之 处 。 第 一 个 区 别 是 没有 
必要 存储 长 度 (长 度 信息 是 实现 数组 操作 才 需 要 的 )。 第 二 个 〈 更 深刻 的 ) 区 别 在 于 启动 程序 
以 语句 EA00 结束 。 由 于 RIA] 包含 加 载 的 第 一 个 字 长 的 地 址 ， 该 指令 用 于 将 控制 权 交 给 刚 
加 载 的 数据 ,这 是 冯 . 诺 依 曼 机 器 中 一 个 典型 的 将 数据 改变 成 指令 的 例子 。 

现代 计算 机 使 用 基本 相同 的 启动 过 程 ， 所 以 这 个 术语 直到 今天 仍 在 使 用 。 当 你 重新 启动 
(reboot) 手机 或 平板 计算 机 或 计算 机 时 ， 操 作 系统 和 许多 基本 应 用 程序 将 通过 一 个 小 程序 从 
处 理 器 外 部 的 存储 器 加 载 到 设备 中 ， 该 程序 通过 一 些 特殊 的 过 程 将 其 自身 加 载 到 处 理 器 内 存 
中 。 然 后 通过 分 支 指令 将 控制 权 交 给 该 程序 。 

导出 。 如 果 要 编写 一 个 程序 ， 用 于 生成 打 孔 的 纸 带 以 供 启动 程序 加 载 ， 那 么 简单 的 方法 
就 是 修改 启动 程序 代码 ， 让 它 在 纸 带 上 打出 加 载 地 址 和 程序 长 度 ， 并 循环 打出 待 加 载 程序 的 
每 个 内 存 字 (原来 的 启动 程序 是 读 取 这 些 信息 )。 这 些 更 改 在 下 图 右 下 方 显示 的 导出 程序 中 


0050 
0007 
7800 
8CFF 
KR55 
188C 
CO51 
9CFF 
0000 
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以 粗 体 突出 显示 。 前 两 个 字 是 指令 加 载 地 址 和 长 度 一 一 程序 员 可 以 将 它们 (通过 开关 ) 设置 
为 任何 值 。 值 10 (地 址 ) 和 EF (长 度 ) 指定 了 一 个 “完全 导出 ”(full dump): 我 们 只 将 从 10 
到 FE 的 内 存 字 导出 ， 因 为 00 一 0F 是 为 导出 /启动 程序 本 身 预 留 的 空间 ， 而 FF 预 留 给 标准 


输入 和 标准 输出 。 这 个 过 程 被 称 为 导出 (dumping) 内 存 的 内 容 。 


00: 7A10 RIA] <- 0010 


read/write 01: . 7BEF, ,R[B] ,<» 239,0 
02: 8AFF RI[A] from stdin address of a[] 02: 9AFF  R[A] to stdout 
03: 8BFF RI[B] from stdin b =length of a[] 03: 9BFF R[B] to stdout 
04 7101 R[1] <- 0001 04 7101 RI[1] <- 0001 
05: 7900 R[9] <- 0000 .03 05: 7900 R[9] <- 0000 
06: 22B9 R[2] <- R[B] - R[9] while (i < b) 06: 22B9 R[2] <- R[B] - R[9] 
07: C20D if (CR[2]==0) PC <- 0D { 07: C20D fi (R[2]==0) PC <- 0D 
08: 1CA9 R[C] <- R[A] + R[9] address of af[i] 08: 1CA9 RI[C] <- RI[A] + R[9] 
09: 8DFF R[D] from stdin 09: ADOC RI[D] <- MI[R[C]] 
0A: BDOC M[R[C]] <- RI[D] read/write a[il] OA: 9DFF R[D] to stdout 
0B: 1991 R[9] <- R[9] + 1 第" OB: 1441 R[9] <- R[9] + 1 
0C: C006 PC <- 06 } 0C: C006 PC <- 06 
0D: EA0O0 PC <- RIA] 0D: 0000 halt 

启动 ( 见 程序 5.3.5 ) 导出 
启动 和 导出 


对 于 TOY 这 类 计算 机 ， 这 两 个 简单 的 过 程 大 大 简化 了 程序 员 的 工作 流程 。 编 程 工作 首 
先 需要 通过 使 用 开关 输入 引导 程序 ， 然 后 运行 引导 程序 以 从 纸 带 加 载 各 种 程序 。 如 果 某 一 天 
的 工作 用 到 了 新 的 代码 〈 通 过 开关 输入 )， 那 么 可 以 对 程序 做 一 些 改动 (在 我 们 的 例子 中 ， 需 
要 修改 内 存 位 置 00 一 03 和 09 一 0A) 将 启动 转换 为 导出 ， 将 新 的 代码 打 孔 成 纸 带 来 保存 ， 以 


供 其 他 时 间 使 用 。 

例如 ， 在 输入 和 调试 程序 来 计算 斐 波 那 契 数列 (程序 6.3.2 ) 之 
后 ， 我 们 可 以 保存 这 个 程序 。 需 要 注意 的 是 ， 该 程序 包含 的 0D 个 字 
存储 在 40 到 4C 位 置 。 使 用 开关 将 00 的 指令 改 为 7A40，01 的 指令 改 
为 7B0D， 然 后 将 地 址 开关 设置 为 00， 最 终 按 下 RUN 键 以 运行 导出 程 
序 ， 生 成 如 右 图 的 纸 带 ， 随 后 ， 我 们 可 以 随时 从 这 个 纸 带 启动 以 加 载 
这 个 程序 。 

不 难 想象 程序 员 很 快 就 开发 出 了 一 系列 包含 各 类 代码 的 打 孔 纸 带 ， 
你 可 以 将 这 样 的 集合 看 作 是 外 部 存储 (external storage) 的 早期 形式 ， 
而 引导 程序 是 安装 程序 (installer) 的 一 个 早期 形式 ， 你 现在 经 常 使 用 
这 些 技术 来 将 程序 放 到 移动 设备 上 。 

注意 接 下 来 ,我 们 讨论 一 个 例子 来 说 明 虽 然 冯 : 诺 依 曼 架 构 在 
许多 方面 令 人 惊叹 , 但 也 可 能 存在 危险 。 

像 TOY 机 上 这 样 的 典型 工作 流程 可 能 是 让 科学 家 开发 一 个 处 理 实 
验 数据 的 程序 ， 然 后 在 数 周 或 数 月 的 时 间 内 使 用 该 程序 来 实际 处 理 数 
据 。 由 于 这 个 活动 只 需要 运行 加 载 程序 (通过 开关 输入 启动 程序 ,或 





0040 
000D 
7101 
7A00 
7B01 
894C 
C94B 
9AFF 
1l1CAB 
lABO 
lBCO 
2991 
C044 
0000 
000C 


程序 6.3.2 的 导出 


者 只 是 检查 发 现 它 已 经 被 加 载 ， 然 后 就 直接 使 用 它 )， 然 后 将 数据 加 载 到 纸 带 阅读 器 上 以 供 
程序 处 理 ， 所 以 经 常 是 雇佣 机 器 操作 员 (不 需要 有 编程 基础 或 科学 技能 ) 来 做 这 些 工 作 。 机 
器 操作 员 可 以 在 机 器 上 加 载 一 个 科学 家 的 程序 ， 然 后 在 不 同 的 实验 数据 集 上 运行 它们 ， 这 种 


工作 可 能 需要 持续 几 个 小 时 。 


现在 想象 一 个 人 需要 运行 一 个 大 型 程序 ， 程 序 的 开始 部 分 使 用 程序 6.3.4( 驻 留 在 内 
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存 位 置 60 到 6D) 来 加 载 一 个 数组 。 有 一 天 ,一 位 同事 要 求 使 用 该 程序 ， 并 向 操作 员 提 供 
右 图 所 示 的 纸 带 。 操 作 员 将 纸 带 放 在 阅读 器 上 ， 按 下 RUN 之 后 (也 





许 ) 去 吃 午 餐 : 纸 带 的 内 容 是 从 50 开始 加 载 一 个 21 个 字 的 数组 ; 会 名 
发 生 什么 ? 相 庆 

如 果 我 们 采用 计算 机 的 观点 ， 分 析 这 种 情况 并 不 困难 。 我 们 都 8888 
知道 ， 无 论 PC 指定 地 址 的 指令 是 什么 ， 机 器 都 会 抓 取 指令 、 递 增 
PC、 执 行 指令 ， 然 后 再 继续 重复 这 个 周期 ， 直 到 遇 到 停机 指令 。 在 Ens 
这 个 例子 中 ， 引 导 程 序 会 读 到 预期 的 地 址 和 长 度 ， 然 后 加 载 纸 带 上 8888 
的 16 个 字 , 但 是 当 R[9] 是 5F 然后 递增 时 ， 我们 需要 仔细 分 析 这 个 < 
情况 。 8888 

当 我 们 递增 SF 时 ， 我 们 得 到 结果 60， 所 以 数据 的 下 一 个 字 存 储 % 8888 
在 60 中 ,然后 再 下 一 个 字 存 储 在 61 中 ， 以 此 类 推 ， 如 下 表格 所 示 。 
这 个 过 程 产生 的 结果 可 能 是 意料 之 外 的 ， 因 为 读 取 数 组 的 程序 正在 履 
盖 自 己 。 最 终 ， 程 序 会 开始 执行 这 些 指令 ， 而 这 些 指 令 原 先是 纸 带 上 8888 
的 数据 在 这 个 例子 中 ;指令 会 跳 转 回 到 先前 的 指令 (这 个 指令 原先 2 
也 是 纸 带 上 的 数据 )， 运 行 的 结果 便 是 机 器 进入 无 限 循 环 ,，: 以 尽 可 能 快 福 疝 
的 速度 在 纸 带 上 打 孔 8888。 这 个 操作 员 吃 完 午餐 后 回来 ， 一 定 想 不 到 8888 
会 看 到 这 样 的 情况 。 沪 竺 

这 个 虚构 的 故事 简单 地 展现 了 控制 计算 机 中 出 现 的 意外 。 打 孔 说 上 
8888 的 三 行 循环 可 能 是 任何 程序 ， 而 且 这 个 过 程 也 不 必 一 定 要 在 启动 0000 
程序 中 出 现 。 针 对 我 们 的 数组 输入 程序 或 任何 其 他 的 读 取 和 保存 数据 
的 程序 ， 你 都 可 以 按照 类 似 的 思路 来 控制 程序 的 执行 逻辑 。 神秘 纸 带 

首 令 66 一 68 的 效果 
RICJ 路 60 61 62 63 64 


data 
62: 7101 7101 7101 8861 8861 8861 R[8] <- M[61] 
63: 7900 7900 7900 7900 98FF 98FF R[8] to stdout 
64: 22B9 22B9 22B9 22B9 22B9 C062 PC <- 62 


通过 缓冲 区 溢出 攻击 控制 TOY 机 器 


几 十 年 来 困扰 计算 机 用 户 的 计算 机 病毒 与 这 种 情况 类 似 。 在 很 多 情况 下 ， 计 算 机 系统 
很 容易 被 攻击 ， 将 控制 转移 到 内 存 中 某 个 被 设 定 为 数据 的 区 域 ， 就 会 产生 各 种 可 怕 的 后 果 。 
举 一 个 例子 ， 对 于 C 语言 编写 的 典型 程序 ， 在 用 户 提 供 的 字符 串 参 数 比 函数 期 望 的 要 长 时 ， 
就 会 受到 缓冲 溢出 攻击 (buffer overflow attack) 。 由 于 函数 代码 出 现在 原本 用 来 保存 字符 串 
的 内 存 缓冲 区 之 后 ， 恶 意 用 户 可 以 使 用 比 预期 更 长 的 字符 串 对 程序 进行 编码 ， 就 像 我 们 的 
例子 一 样 。 系 统 将 控制 转移 到 函数 应 该 在 的 存储 器 位 置 ， 但 这 其 实 就 是 将 控制 交 给 了 恶意 
用 户 。 如 果 此 时 的 代码 是 病毒 (virus) 程序 ， 则 该 代码 会 试图 连接 并 感染 其 他 计算 机 ， 导 致 
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情况 迅速 升级 。 记 录 在 案 的 这 类 案件 层出不穷 ， 困 扰 了 数 百 万 计算 机 用 户 ， 并 且 问 题 仍 在 
继续 。 

我 们 不 能 写 一 个 程序 来 检查 这 种 情况 吗 ? 不 是 有 病毒 防护 软件 的 帮助 吗 ? 遗憾 的 是 ， 这 
样 的 软件 只 是 扫描 已 知 的 病毒 ， 而 且 也 不 能 确定 给 定 的 指令 序列 可 能 会 做 什么 。 的 确 ， 一 般 
来 说 ， 正 如 停机 问题 的 不 确定 性 证 明 一 样 (参见 5.4 节 ), 不 可 能 编写 一 个 程序 来 检查 某 个 程 
序 是 否 是 病毒 。 

处 理 程 序 的 程序 好 消息 是 ,在 许多 情况 下 ， 编 写 将 其 他 程序 作为 输入 (或 输出 ) 的 程 
序 是 非常 有 用 的 。 自 从 在 1.1 节 讨 论 Java 编译 器 和 Java 虚拟 机 以 来 ,我 们 已 经 非 正 式 地 讨 
论 了 这 些 程序 ， 现 在 结合 TOY 的 知识 ， 我 们 可 以 提供 更 多 的 细节 。 

汇编 程序 。 用 十 六 进 制 数字 直接 编程 很 不 方便 上 且 易 产生 错误 ， 所 以 许多 计算 机 的 初期 开 
发 使 用 的 是 汇编 语言 (assembly language)， 它 使 得 程序 员 可 以 为 操作 指令 和 机 器 地 址 建立 符 
号 名 称 。 汇 编程 序 是 将 汇编 语言 程序 作为 输入 并 生成 机 器 语言 程序 作为 输出 的 程序 。 在 Java 
中 编写 TOY 的 汇编 程序 并 不 困难 (参见 练习 6.4.13 ) 。 虽 然 在 TOY 代码 中 做 这 项 工作 有 点 
难度 ， 但 是 早期 的 程序 员 在 面 对 各 种 新 设计 的 计算 机 时 都 要 应 对 这 个 困难 。 汇 编 语言 程序 设 
计 在 今天 仍然 是 普遍 存在 的 。 

解释 器 。 解 释 器 (interpreter) 是 用 来 直接 执行 用 编程 语言 编写 的 代码 的 程序 。 我 们 已 经 
看 到 了 一 个 解释 器 的 简单 例子 : 程序 4.3.5， 它 的 功能 是 用 来 计算 算术 表达 式 。 一 个 算术 表 
c1+ (2-3)) 达 式 用 一 种 简单 的 编程 语言 来 指定 一 个 计算 任务 ， 程序 4.3.5 执行 这 个 计 

| 算 任务 。 这 个 过 程 非常 简单 ， 你 可 以 想象 在 TOY 中 如 何 实现 它 (参见 练 


习 6.4.15 )。 许 多 现代 编程 语言 程序 都 使 用 解释 器 来 处 理 。 使 用 基于 解释 





器 的 系统 的 主要 原因 是 它 可 以 是 交互 式 的 一 一 你 可 以 一 次 输入 一 个 指令 。 

0 不 使 用 这 种 系统 的 一 个 主要 原因 是 它 可 能 是 低 效 的 ， 因 为 每 一 条 遇 到 的 源 

表达 式 解释 器 。 代码 语句 都 必须 被 解析 和 处 理 。 i 
编译 器 。 编 译 器 (compiler) 是 将 一 种 计算 机 语言 (通常 是 源 代码 ) | 


转换 成 男 一 种 计算 机 语言 (通常 是 机 器 语言 ) 的 程序 ， 通 常用 于 创建 可 执 


行程 序 。 为 了 更 好 地 理解 这 个 概念 ， 我 们 鼓励 你 完成 练习 6.4.14， 在 这 里 


你 需要 把 算术 表达 式 求 值 器 转换 成 编译 器 。 例 如 ， 当 解释 器 在 遇 到 “+” Hoi 
号 时 执行 加 法 ， 编 译 器 将 输出 执行 加 法 的 机 器 指令 。 在 整个 源 程序 被 处 7603 
理 后 ， 我 们 得 到 的 结果 是 一 个 机 器 语言 程序 。 大 多 数 在 产业 界 中 使 用 的 证 
编程 系统 都 是 基于 编译 的 ， 因 为 现代 编译 器 可 以 生成 与 手写 代码 解决 方 ee 


案 一 样 高 效 (甚至 更 高 效 ) 的 机 器 语言 程序 。 

虚拟 机 。 虚 拟 机 定义 的 是 这 样 的 一 人 台 机 器 : 它 可 以 像 真 机 一 样 执 行程 序 ， 但 不 需要 与 
任何 物理 硬件 直接 对 应 。 当 然 ，TOY 是 一 个 虚拟 机 ! 从 历史 土 看 ， 这 个 术语 已 经 发 生 了 
很 大 变化 。 因 此 ， 为 了 不 重 写 已 有 的 软件 ， 每 一 个 新 的 计算 机 设计 都 配 有 一 个 名 为 仿真 器 
( emulator) 的 软件 或 硬件 ， 其 可 以 运行 为 其 前 身 编 写 的 程序 。 虚 拟 机 最 早 的 用 途 之 一 是 分 时 
操作 ( timesharing)， 这 种 软件 会 给 出 计算 机 多 个 副本 的 错觉 ， 而 实际 上 所 有 这 些 都 运行 在 
一 全 计算 机 上 。 虚 拟 机 在 早期 的 另 一 个 用 法 是 ， 用 作 高 级 语言 和 机 器 硬件 之 间 的 抽象 中 间 层 
(这 是 我 们 接 下 来 要 研究 的 Java 方 法)。 在 现代 计算 中 ， 术 语 虚 拟 机 ( virtual machine) 是 涵 
盖 了 所 有 这 些 含义 的 。 

JVM。Java 虚拟 机 是 一 个 典型 案例 。Java 系统 的 设计 者 知道 ， 与 其 为 每 一 种 处 理 器 开 
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发 一 个 Java 编译 器 ， 不 如 定义 一 个 具有 许多 真实 机 器 特性 的 虚拟 机 (寄存 器 、 存 储 器 、 程 序 
计数 器 、 执 行 算术 和 逻辑 操作 的 指令 ; 在 寄存 器 和 存储 器 之 间 传 递 信息 ; 并 执行 分 支 和 跳 转 )， 
在 这 个 虚拟 机 上 定义 一 个 被 称 为 字 节 码 (bytecode) 的 指令 集 ， 并 由 解释 器 有 效 地 执行 字 节 
码 程序 。 然 后 他 们 可 以 把 所 有 的 精力 都 放 在 开发 一 个 从 Java 到 JVM 的 编译 器 上 。 以 下 图 表 
描述 了 他 们 遵循 的 过 程 。 为 了 使 Java 在 任何 特定 的 计算 机 上 工作 ,为 JVM 编写 一 个 解释 器 
就 足够 了 一 一 这 比 为 Java 开发 一 个 新 的 编译 器 要 容易 得 多 。 尽 管 Java 是 几 十 年 前 开发 的 ， 
但 即使 在 今天 ， 它 也 能 成 功 地 用 于 新 机 器 上 。 作 为 该 思想 的 实用 性 的 进一步 证 据 ， 程 序 员 们 
甚至 开发 了 编译 到 JVM 的 新 语言 。 这 些 语 言 可 以 运行 在 任何 可 以 运行 Java 程序 的 设备 上 。 


javac HelloWorld. java Hello 


java 调 用 编译 器 World 调 用 JVM 
Hel1lowWor1d.java 一 一 >~| Java 编译 器 HeVloworid.class—| TVM|- "Hello, World" 
源 程 序 程序 翻译 成 JVM 代 码 输出 
(一 个 文本 文件 ) ( 二进制 文件 ) 
处 理 程序 的 程序 


这 类 程序 的 形式 是 多 种 多 样 的 ， 而 且 都 是 非常 有 趣 的 ， 你 从 事 的 计算 任务 越 多 ， 遇 到 它 
们 的 情况 就 越 多 。 程 序 和 数据 之 间 的 唯一 区 别 就 是 上 下 文 。 在 TOY 中 ， 如 果 PC 中 保存 了 
某 个 内 存 字 的 地 址 ， 则 这 个 字 就 是 一 条 指令 ; 否则 ， 它 就 是 数据 。 汉 “ 诺 依 曼 机 器 的 这 个 本 
质 特 征 是 现代 计算 的 一 个 关键 属性 。 图 灵 构 思 了 这 个 想法 ， 冯 : 诺 依 曼 在 实践 中 把 握 了 它 的 
重要 性 ， 而 整个 世界 从 中 得 利 至 今 。 

在 目前 的 情况 下 ， 我 们 最 重要 的 兴趣 在 于 Java 和 TOY 之 间 的 关系 ， 所 以 我 们 接 下 来 讨 
论 这 个 话题 。 

Java 中 的 TOY 你 需要 仔细 研究 Java 程序 6.4.1， 从 而 获得 一 个 直观 的 感受 ， 这 个 程 
序 就 是 TOY 机 器 的 实现 ,我 们 用 它 来 实现 和 调试 本 书 中 的 所 有 TOY 程序 (我 们 鼓励 你 自己 
使 用 它 来 实现 和 调试 一 些 TOY 程序 )。 你 会 惊讶 于 这 个 程序 怎么 这 么 容易 理解 。 事 实 上 ,我 
们 设计 TOY 时 主要 考虑 因素 之 一 就 是 要 足够 简单 ， 尽 量 用 一 页 纸 就 能 够 描述 清楚 。 除 了 标 
准 输入 和 标准 输出 的 代码 之 外 ， 这 个 程序 已 经 是 完整 的 了 。 这 里 我 们 省 略 输入 输出 代码 ， 以 
便 我 们 专注 于 虚拟 机 的 核心 部 分 。 

解析 TOY 指令 。 假 设 我 们 在 一 个 整 型 变量 IR 中 保存 一 个 TOY 指令 。 它 是 一 个 32 位 
的 值 ， 但 TOY 指令 只 是 16 位 ， 所 以 只 用 处 理 最 右边 的 16 位。 通过 我 们 在 6.1 节 中 所 学 习 
的 移 位 和 掩 码 操作 ， 我 们 可 以 分 离 出 操作 码 、 寄 存 器 和 地 址 ， 以 备 以 后 使 用 : 


int op = (IR >> 12) & OxF; 
int d = (IR >> 8) & OxF; 
int s = (IR >> 4) & OxF; 
int t = (IR >> 0) & OxF; 
int addr = (IR >> 0) & OxFF; 


对 于 任何 特定 的 指令 ,我们 可 能 会 使 用 s 和 t 或 addr, 但 不 能 同时 使 用 ,但 最 简单 的 方 
法 就 是 对 每 条 指令 都 把 它们 三 个 的 值 计算 出 来 。 

机 器 的 状态 。 我 们 从 一 开始 就 注意 到 TOY 机 器 的 行为 完全 由 寄存 器 〈 特 别 是 PC) 的 内 
容 和 存储 器 的 内 容 决 定 。 这 个 事实 自然 引起 我 们 在 程序 6.4.1 中 选择 实例 变量 : 我 们 使 用 一 个 
包含 16 个 整 型 值 的 数组 作为 寄存 器 ， 一 个 包含 256 个 整 型 值 的 数组 作为 内 存 ， 一 个 单独 的 整 
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型 值 用 于 PC。 再 次 ， 我 们 实际 上 只 使 用 这 些 值 的 最 右边 的 16 位 (参见 本 节 结 尾 的 问答 环节 )。 
需要 注意 的 是 ， 当 我 们 考虑 到 标准 输入 时 ， 即 使 机 器 本 身 是 一 个 有 限 状 态 的 机 器 ， 机 器 
状态 的 大 小 也 是 不 受 限 的 。 内 存 和 寄存 器 只 有 4160 位 ,但 输入 纸 带 上 的 位 数 是 无 限 的 。 


程序 6.4.1 ”TOY 虚拟 机 (无 标准 输入 输出 ) 


public class TOY 
{ 





private int[] R = new int[16]; 
private int[] M = new int[256]; 
private int PC; 


public TOY(CString filename) // 构造 函数 ; 见 文本 
public void runQO 


while (true) 
{ 


int IR = M[PC]; /提取 
PC = (PC + 1) & 0XFF;”。 // 增 量 
int op = (IR >> 12) & OxF; 
int d = (IR >> 8) & OxF; 
int s = (IR >> 4) & OxF; 
int t = (IR >> 0) & OxF; 
int addr = (IR >> 0) & OxFF; 
if (op == 0) break; 

switch (op) 

€ 


Case 
Case 
Case 
Case 
case 
Case 
Case 


: R[d] R[s] + RI[t]; 
: R[d] = R[s] - RI[t]; 
R[d] = R[s] & RI[t]; 
R[d] = R[s] 和 A RI[t]; 
R[d] = R[s] << R[t]; 
R[d] = (short) R[s] >> RI[t]; 
: R[d] = addr; 
case : R[d] = M[addr]; 
case : M[addr] = R[d]; 
case 10: R[d] = M[R[t] &OxFF]; 
case 11: M[R[t] & OxFF] = R[d]; 
case 12: if ((short) R[d] == 0) PC = addr; 
case 13: if ((short) R[d] > 0) PC = addr; break; 
case 14: PC = R[d] & OxFF; break; 
case 15: REd]. = PC; PC =faddr; break; 
} 
R[d] = R[d] & OxFFFF; 
R[0] = 0; 


‘WOONAOUMPAWN PP 


} 
和 


public static void main(String[] args) 
信 见 练习 6.4.2X/ 





启动 机 器 。 为 了 在 运行 TOY 模拟 器 时 略微 简化 我 们 的 工作 流 

程 ， 我 们 在 构造 函数 中 启动 机 器 ， 如 下 面 的 代码 所 示 。 客 户 程序 提 。。 % more fib'toy 
供 文 件 名 和 PC 的 初始 值 作为 参数 一 一 文件 中 存储 指令 序列 ， 每 行 41: 7A00 
包含 内 存 地 址 和 相应 的 指令 ， 之 间 用 冒号 和 空格 分 隔 。 右 边 的 例子 。。 43; 894c 
程序 fib.toy 是 一 个 13 字 节 的 程序 一 一 与 之 前 的 程序 6.3.3 相同 , 它 。 44: C948 


需要 加 载 到 M[40 一 4C] 中 ， 并 通过 将 PC 设置 为 40 来 运行 。 也 就 是 46: 1CAB 
说 ,我 们 把 TOY 程序 保存 在 一 个 文件 中 ， 然 后 通过 在 构造 函数 中 提 ” 4: 18c0 


48: 1BCO 
供 该 文件 的 文件 名 和 PC 的 初始 值 以 实现 从 该 文件 启动 。 构 造 函 数 er 


通过 在 指定 的 内 存 位 置 保存 指令 序列 来 加 载 TOY 内 存 。 构 造 函 数 完 ”48: 0000 
成 后 ，TOY 程序 就 可 以 通过 调用 run() 方法 来 执行 了 。 4C: 000C 
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public TOY(String filename，int pc) 
{ 


PC pc &-OxFFS 

In in = new In(filename); 
while (in.hasNextLineQO) 
{ 


String line = in.readLine(); 
String[] fields = line.split("[:\\s]+") 


int addr = Integer.parseInt(fields[0], 16) & OxFF; 


int inst = Integer.parseInt(fields[1], 16) & 0xFF 
M[addr] = inst; 


TOY 虚拟 机 的 构造 函数 


EF; 


这 种 特殊 的 启动 过 程 实际 上 反映 了 最 终 出 现在 真实 计算 机 上 的 方法 ,不 同 之 处 是 真实 


计算 机 会 使 用 一 些 输 入 设备 来 启动 ， 而 启动 的 过 程 因 设备 不 同 而 不 同 。 


详细 机 制 在 此 不 再 更 


述 ， 我 们 的 主要 兴趣 在 于 当 内 存 被 加 载 并 且 PC 已 经 用 指定 的 地 址 初始 化 时 会 发 生 什 么 。 在 
我 们 的 例子 中 ,我 们 调用 run0 方法 。 这 个 动作 模拟 一 个 操作 员 在 输入 或 引导 程序 并 将 开关 


设置 为 开始 地 址 之 后 按 下 RUN 按钮 的 动作 。 


运行 。run() 方法 是 模拟 器 的 核心 ， 其 实现 非常 简单 。 我 们 把 PC 中 地 址 的 指令 取 到 一 个 


整 型 变量 IR 中 ， 然 后 递增 PC (在 一 条 语句 中 完成 这 两 个 操作 )。 
然后 我 们 解码 指令 的 所 有 组 成 部 分 (操作 码 、 结 果 寄 存 器 、: 参 数 
寄存 器 和 地 址 )， 如 刚刚 所 述 。 根 据 提取 的 这 些 信息 来 改变 机 器 状 
态 ， 这 个 过 程 是 在 switch 语句 中 实现 的 。 也 就 是 说 ,我 们 在 这 里 
模拟 指令 的 执行 。 很 容易 看 出 每 条 指令 的 作用 ， 因 为 每 条 指令 的 
Java 代码 与 我 们 在 第 一 次 引入 时 的 描述 是 一 致 的 。 

接 下 来 发 生 的 事情 完全 取决 于 指令 及 其 引起 的 机 器 状态 的 变 
化 。 与 TOY 按照 其 PC 执行 指令 的 方式 相同 ， 虚 拟 机 根据 其 PC 
变量 执行 指令 ， 直 到 遇 到 停机 指令 (操作 码 0 )5 对 于 我 们 的 示例 
程序 fib.toy， 如 右 图 所 示 ， 其 结果 正如 预想 的 一 样 ,会 在 标准 输 
出 上 打印 出 斐 波 那 契 数 。 


private void stdin(int addr，int op, int t) 


if ((addr == OxFF && op == 8) || (R[t] == OxFF && op == 
M[OxFF] = Integer.parseInt(StdIn. readStringc) 16) & 


private void stdout(int addr, int op, int +t) 
{ 
if ((addr == OxFF && op == 9) || (R[t] == 0xFF && op == 
StdOut.printf("%04X\n", M[OxFF]); 


TOY 虚拟 机 的 标准 输入 和 标准 输出 


% java TOY fib.toy 
0000 
0001 
0001 
0002 
0003 
0005 
0008 
000D 
0015 
0022 
0037 
0059 





10)) 
OxFFFF:; 


11)) 


标准 输入 与 输出 。 启 动 过 程 中 加 载 的 程序 来 自 于 文件 ， 所 以 我 们 可 以 使 用 StdIn 作为 标 
准 输 入 ，StdOut 作为 标准 输出 。 具体 而 言 ， 我 们 需要 : 在 一 个 加 载 指令 (操作 码 8) 或 间接 
加 载 指令 (操作 码 A) 访问 内 存 位 置 FF 时 从 标准 输入 读 取 一 个 值 ; 并 在 存储 指令 (操作 码 9 ) 


或 间接 存储 指令 (操作 码 B) 访问 内 存 位 置 FF 时 向 标准 输出 写 入 一 个 


值 。 相 应 的 代码 实现 


如 上 stdin() 和 stdout() 方法 所 示 。 要 将 标准 输入 和 标准 输出 添加 到 程序 6.4.1 中 ， 只 需 在 主 
语句 switch 之 前 添加 调用 stdin (addr，op，t)， 之 后 添加 调用 stdout (addr，op，t)。 另 一 种 
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实现 方法 是 , 我们 可 以 在 访问 内 存 之 前 检查 目标 地 址 并 执行 相应 的 操作 ， 我 们 将 在 第 7 章 中 
看 到 ， 实 际 上 硬件 更 倾向 于 后 面 这 种 实现 方案 。 实 现 的 细节 不 再 歼 
% more sum.toy 述 一 一 我 们 这 里 只 是 为 了 准确 地 模拟 机 器 的 行为 。 还 需要 说 明 的 是 ， 


50: 7800 


和 为 了 避免 不 必要 的 工作 量 ， 我 们 并 没有 做 类 似 打 孔 纸 带 那样 的 二 进 
ss 制 输入 和 输出 (参见 练习 6.4.3 )。 

54: C051 左边 的 例子 展示 了 sum.toy 的 内 容 ， 这 个 文件 是 一 个 7 字 节 的 程 
bt 序 ， 实 现 细节 如 程序 6.3.3 所 示 。sum.txt 是 这 个 程序 的 采样 数据 ， 将 
，， .ww。 是 “在 标准 输入 中 出 现 ， 模 拟 一 条 打 好 孔 的 纸 带 。 当 需要 执行 这 段 代码 
0001 时 ，TOYjava 中 的 测试 代码 将 程序 加 载 到 MI[50 一 56]， 将 PC 设置 为 
00 50， 并 调用 run()。 模 拟 标准 输入 很 简单 一 我 们 重 定向 标准 输入 来 
po 自 sum.txt， 如 右 侧 的 代码 所 示 。 每 次 执行 8CFF 指令 时 ， 模 拟 器 会 调 
00D8 用 stdin0 从 标准 输入 获取 数据 并 填 和 人 M[FF]， 所 以 程序 实现 的 功能 
| 就 是 读 取 所 有 数字 并 将 它们 相 加 求 和 。 最 后 ， 用 98FF 指令 将 结果 写 
0000 入 标准 输出 并 停机 。 你 可 以 





看 到 ， 对 于 任何 TOY 程序 ， % java TOY sum.toy 50 < sum.txt | 
大 抵 都 是 这 样 的 执行 过 程 。 人 

开发 TOY 程序 。 如 果 需 要 的 话 ， 我 们 可 以 轻 
松 地 对 程序 6.4.1 进行 修改 ， 以 便 获 取 程 序 运行 过 程 中 PC 的 路 径 、 寄 存 器 内 容 和 受 影响 的 
内 存单 元 等 ， 也 可 以 在 任何 需要 的 时 候 提供 内 存 导出 (参见 练习 6.4.3 ) 。 在 20 世纪 80 年 代 
初 ， 程 序 员 花 费 了 大 量 的 时 间 去 处 理 内 存 导 出 ， 因 为 这 是 和 弄 清 机 器 内 部 发 生 的 各 种 错误 的 
唯一 方法 。 事 实 上 ， 你 可 能 会 将 程序 6.4.1 扩展 ， 把 它 当 成 TOY 的 开发 环境 ， 可 以 使 用 它 
来 开发 和 调试 TOY 程序 。 此 外 ， 你 可 以 为 它 添加 代码 以 获得 任何 需要 的 信息 ， 用 来 分 析 你 
的 程序 正在 做 什么 。 所 有 这 一 切 都 比 在 真实 的 TOY 机 器 上 《在 这 个 例子 中 ,这 是 不 可 能 的 ， 
因为 没有 真正 的 TOY 机 器 ) 做 要 容易 得 多 。 你 可 以 在 程序 6.4.1 的 基础 上 继续 添加 代码 ， 只 
要 是 你 认为 在 程序 开发 的 过 程 中 可 能 会 需要 的 功能 都 可 以 试 着 实现 。 事 实 上 ， 你 可 以 在 本 
书 网 站 上 找到 一 个 模拟 器 〈 它 也 是 由 学 生 编写 的 ， 与 你 一 样 的 初学 者 )， 它 包含 了 一 个 显示 
开关 和 指示 灯 的 图 表 ; 支持 跟踪 和 内 存 导出 ， 一 次 一 个 指令 地 执行 程序 ; 并 提供 了 许多 其 
他 功能 。 

摩尔 定律 。 在 过 去 的 六 七 十 年 里 ， 最 先进 的 计算 机 的 速度 和 内 存 大 概 每 18 个 月 翻 一 番 。 
这 个 经 验 法 则 叫 作 摩 尔 定律 。 它 给 我 们 带 来 了 一 个 持续 的 挑战 : 我们 如 何 构 建 一 台新 的 计算 
机 ， 同 时 又 不 会 浪费 我 们 在 开发 软件 方面 的 所 有 努力 ? 虚拟 机 在 这 个 过 程 中 起 着 至 关 重 要 的 
作用 ， 因 为 任何 新 计算 机 的 设计 早期 就 是 在 旧 计算 机 上 构建 一 个 类 似 于 程序 6.4.1 的 虚拟 机 。 
这 种 方法 有 几 个 好 处 ; 

。 可 以 在 新 计算 机 创建 之 前 开发 在 其 上 运行 的 软件 。 

。 计算 机 一 旦 建成 ， 可 以 根据 虚拟 机 的 操作 来 检查 其 实际 操作 ， 以 验证 硬件 的 正确 性 。 

。 为 新 计算 机 开发 的 早期 软件 很 可 能 是 旧 计 算 要 的 虚拟 机 ! 这 样 ， 为 旧 计 算 机 开发 的 任 

何 软 件 都 可 以 在 新 计算 机 上 运行 。 

例如 ， 我 们 可 以 创建 一 个 TOY 程序 来 实现 TOY 虚拟 机 本 身 吗 ? 当然 ! 尽管 程序 6.4.1 
是 一 个 相对 简单 的 Java 程序 ， 但 翻译 其 他 Java 程序 也 并 不 困难 ( 见 练习 6.4.10 )。 既 然 我 
们 拥有 了 一 个 TOY 虚拟 机 ， 我 们 就 可 以 不 断 改进 它 : 我 们 可 以 添加 更 多 的 指令 、 更 多 的 寄 
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存 器 、 不 同 的 字 长 大 小 ， 或 任何 我 们 可 能 想 尝试 的 东西 。 由 此 产生 的 TOY 虚拟 机 比 原来 的 
TOY 机 器 “更 强大 ”。 这 个 想法 被 称 为 步步为营 法 (bootstrapping) 一 一 一 旦 我 们 建立 一 台 
机 器 ， 我 们 可 以 用 它 来 创建 “更 强大 ”的 机 器 。 这 个 基本 理念 在 数 十 年 来 计算 机 的 设计 中 发 
挥 了 至 关 重 要 的 作用 。 有 人 句 引 人 瞩目 的 名 言 (当然 ,也 有 可 能 是 杜撰 的 ) 就 很 好 地 传达 了 这 
样 的 想法 : Cray Research 的 创始 人 、 几 代 超 级 计算 机 之 父 Seymour Cray 听 说 苹果 公司 已 经 
买 了 一 台 Cray 来 模拟 计算 机 的 设计 。Cray 感到 很 开心 ， 他 说 :“ 有 意思 ! 我 正在 用 苹果 来 
模拟 Cray 3。” 

还 有 一 个 值得 深思 的 问题 : TOY 是 否 存在 ? 虽然 TOY 机 物理 意义 上 并 不 存在 ,但 是 我 
们 可 以 执行 和 调试 TOY 程序 ， 而 不 依赖 于 是 否 存 在 物理 上 的 TOY 机 器 。 事 实 上 ， 从 这 个 意 
义 上 来 说 TOY 和 Java 没有 区 别 。 我 们 实现 和 调试 Java 程序 ， 但 没有 物理 Java 机 存在 。 实 
际 上 ， 程 序 6.4.1 证 明了 TOY 和 Java 一样 真 实 。 可 能 有 数 十 亿 台 实现 Java 虚拟 机 的 真 机 ， 
其 中 每 一 台 都 实现 了 TOY。 换 名 话说， 就 Java 的 存在 范围 而 言 ，TOY 也 存在 。Java 运行 在 
数 十 亿 台 设备 上 ，TOY 也 一 样 。 

上 一 节 中 我 们 讨论 过 的 程序 都 可 以 很 容易 地 存储 在 文件 中 (事实 上 ， 任 何 TOY 程序 都 
这 样 ); 而 任何 数据 都 可 以 经 由 标准 输入 读 取 。 因 此 ， 在 程序 6.4.1 中 ,构造 函数 将 程序 加 载 
到 TOY 虚拟 机 中 ， 从 标准 输入 上 获取 信息 ， 并 模拟 其 产生 的 操作 ， 并 将 其 输出 (如果 有 的 
话 ) 呈现 在 标准 输出 上 。 

更 重要 的 是 , 任何 人 (包括 你 ) 都 可 以 实现 自己 设计 的 机 器 并 为 其 编写 程序 。 这 是 一 个 
非常 强大 的 创意 ， 它 将 我 们 的 计算 基础 设施 带 到 了 现在 的 状态 ， 并 将 带领 我 们 走向 未 来 。 

TOY 系列 虚拟 计算 机 “我们 的 虚拟 机 器 只 有 256 个 字 的 内 
存 ， 每 个 16 位 。 尽 管 我 们 已 经 证 明 ， 原 则 上 我 们 可 以 在 TOY 
中 开发 任何 可 以 用 Java 开发 的 程序 , 但 是 你 通常 会 产生 的 直接 
反应 就 是 ，TOY 没有 足够 的 内 存 来 做 任何 一 个 实际 应 用 中 重要 
的 计算 任务 。 

但 是 这 个 想法 是 完全 错误 的 。 像 TOY 这 样 的 计算 机 在 被 引 
入 之 后 的 几 年 中 被 用 于 各 种 重要 的 应 用 。 例 如 阿波 罗 导 航 计 算 
机 ( Apollo Guidance Computer)， 六 次 成 功 完成 登 月 导航 任务 ， 
它 只 有 1024 个 16 位 字 的 内 存 ， 只 相当 于 4 个 TOY 机 ! 

外 部 存储 设备 正在 不 断 改 进 ， 从 穿孔 的 纸 带 到 穿孔 卡 ， 再 
到 磁带 和 磁盘 存储 器 ， 程 序 员 们 开始 意识 到 ， 他 们 通过 将 程序 分 阶段 地 存储 进 内 存 ， 就 可 以 
使 用 一 个 相对 较 小 的 (但 昂贵 的 ) 内 部 存储 器 来 完成 他 们 的 工作 ， 然 后 从 外 部 存储 器 中 读 取 
下 一 个 阶段 的 代码 。 到 了 20 世纪 70 年 代 ， 这 种 观点 引出 了 虚拟 内 存 (virtual memory) 的 概 
念 ， 操 作 系 统 为 程序 制造 了 一 种 “错觉 "， 让 它 “ 拥 有 ”了 比 机 器 物理 内 存 大 得 多 的 可 用 内 
存 。 这 个 想法 在 现代 计算 中 仍然 起 着 核心 作用 。 

不 过 ， 随 着 技术 的 进步 ， 我 们 的 内 存 不 断 扩大 ， 机 器 不 断 变 快 。 现 代 计 算 机 拥有 数 十 亿 
位 的 内 存 。 他 们 怎样 与 我 们 的 小 TOY 机 器 联系 起 来 ? 

可 以 肯定 的 是 ， 各 方面 的 技术 进步 是 不 可 思议 的 ， 但 最 重要 的 一 点 是 ， 现 代 计 算 机 上 的 
机 器 语言 程序 的 基本 性 质 与 TOY 编程 之 间 的 差异 比 你 想象 得 小 得 多 。 

TOY-64。 为 了 将 TOY 与 现代 计算 机 联系 起 来 ， 我 们 设想 一 个 64 位 的 TOY 机 器 ,我们 
称 之 为 TOY-64。 对 于 这 样 的 机 器 ， 虽 须 配 备 更 多 的 二 进 制 位 来 指定 寄存 器 和 存储 器 的 位 置 ， 
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但 其 指令 与 我 们 之 前 讲述 的 那些 机 器 完全 一 致 。 具 体 来 说 ， 我 们 可 以 把 40 位 用 于 存储 器 地 
址 ，20 位 用 于 寄存 器 地 址 。 这 意味 着 TOY-64 可 以 容纳 超过 680 亿 个 64 位 字 ， 并 且 使 用 超 
过 250 000 个 寄存 器 ， 这 些 寄存 器 当然 比 TOY 或 PDP-8 


更 接近 当代 的 计算 机 。 
这 个 机 器 的 编程 和 TOY 的 编程 是 一 样 的 ， 除 了 需要 
处 理 更 大 的 内 存 字 ， 更 多 的 寄存 器 和 更 多 的 内 存 以 外 。 即 


使 我 们 没有 展开 过 多 的 细节 ， 你 也 可 以 看 到 ， 所 有 的 东西 。 。“ ”假想 的 64 位 计算 机 
都 会 用 16 位 十 六 进 制 数字 来 表示 ， 我 们 分 析 过 的 所 有 表示 方法 都 可 以 自然 地 扩展 。 例 如 ， 
数字 40544F592D363421 可 以 表示 数字 46354171609002936651o、 字 符 串 “ @TOY-64 !”， 
或 者 一 个 指令 ， 它 将 寄存 器 592D3 和 寄存 器 63421 的 值 按 位 异 或 ， 并 将 结果 存储 在 寄存 器 
0544F 中 。 很 容易 看 到 我 们 如 何 将 一 个 为 TOY 开发 的 程序 转换 成 一 个 可 以 在 TOY-64 上 运 
行 的 程序 。 

因为 这 种 转换 非常 容易 ， 在 构建 新 的 计算 机 时 ， 能 够 大 量 快 速 地 使 用 旧版 软件 就 成 为 一 
个 重要 的 优势 。 事 实 上 ， 我们 今天 使 用 的 大 量 软件 都 是 几 十 年 前 开发 的 ， 但 我 们 依然 可 以 使 
用 它们 的 原因 是 ， 新 机 器 保持 与 旧版 本 的 兼容 性 。 

TOY-64 很 可 能 没有 开关 和 指示 灯 ， 只 有 一 个 无 线 接 口 和 一 个 开 / 关 按 钮 。 技 术 细 节 并 
不 重要 。 重 要 的 是 从 程序 的 角度 来 看 ， 机 器 可 以 访问 长 度 不 受 限 的 输入 /输出 流 。 

TOY-64 和 现代 计算 机 最 显著 的 区 别 是 指令 集 。 典 型 的 机 器 将 更 多 的 位 用 于 操作 码 ， 从 
而 支持 更 丰富 的 指令 来 执行 硬件 上 的 任务 ， 从 浮 点 操作 到 存储 器 操作 ， 再 到 外 部 存储 器 支 
持 。 然 而 ， 硬 币 具 有 两 面 性 : 这 样 任意 扩展 硬件 指令 使 得 软 硬 件 开 发 都 相对 容易 ， 但 与 之 相 
对 应 的 开发 可 靠 的 高 性 能 软件 很 难 ( 译 者 注 : 种 类 复杂 的 指令 集 不 容易 优化 ， 也 不 容易 使 用 
流水 线 和 指令 并 行 等 技术 )， 因 此 发 展 出 了 精简 指令 集 计 算 (RISC)， 并 持续 应 用 至 今 。 典 型 
的 现代 计算 机 可 能 比 TOY-64 指令 多 2 一 4 倍 ， 但 不 会 比 这 更 多 。 

TOY-64 和 现代 计算 机 之 间 另 一 个 显著 的 区 别 是 ， 现 代 计 算 机 没有 太 多 的 寄存 器 ， 或 像 
RR 那样 的 指令 。 我 们 不 再 详 述 这 里 的 差异 ， 需 要 说 明 的 是 所 有 计算 机 都 有 一 个 复杂 的 存储 
体系 结构 ， 从 价格 昂贵 、 容 量 小 、 速 度 快 的 存储 到 价格 便宜 、 速 度 慢 但 容量 大 的 存储 设备 。 
我 们 的 寄存 器 表达 的 是 一 种 设计 思路 ， 任 何 计算 机 体系 结构 必须 考虑 到 内 存 技 术 的 差异 ， 因 
此 我 们 需要 一 个 处 理 器 内 部 的 中 转 存储 。 

这 种 情况 与 我 们 的 模块 化 编程 的 “客户 程序 -API- 实现 模型 ”有 点 不 同 。 软 件 和 硬件 
之 间 的 界限 应 该 在 哪里 ? 很 多 计算 机 已 经 可 以 提供 与 TOY 非常 类 似 的 编程 接口 ， 你 随时 可 
以 开始 在 其 上 编写 程序 ， 所 需 的 努力 可 能 与 学 习 一 种 新 的 编程 语言 类 似 。 





TOY TOY-64 TOY:8 


每 个 字 长 的 位 数 16 64 8 
寄存 器 数量 16 262 144 1 

内 存 中 的 字数 256 68719476736 32 

每 个 操作 码 的 位 数 4 4 3 
每 个 寄存 器 地 址 的 位 数 4 20 0 
每 个 内 存 地 址 的 位 数 8 40 5 


TOY 系列 产品 的 参数 





TOY 系列 虚拟 计算 机 


TOY-8。 为 了 能 够 将 TOY 与 计算 机 的 电路 实现 相关 联 ， 我 们 还 在 第 7 章 中 假想 了 一 个 
8 位 的 TOY 机 器 ， 它 配 有 32 字 节 的 存储 器 和 一 个 寄存 器 ， 我 们 称 之 为 TOY-8。 为 这 样 的 机 
器 编写 程序 似乎 是 一 个 挑战 ， 但 是 请 注意 ， 我 们 在 本 节 中 分 析 过 的 所 有 程序 所 需 的 内 存 都 没 
有 超过 32 字 节 。 当 你 意识 到 一 个 程序 可 以 从 纸 带 上 读 取 更 多 的 代码 时 ， 你 可 以 看 到 ， 实 际 
上 用 这 样 一 个 微小 的 机 器 完成 一 些 艰巨 的 任务 是 有 可 能 的 。 

一 个 明显 的 事实 是 : 即使 在 TOY-8 中 ,存储器 的 可 能 状态 的 数量 也 已 经 达到 2256 个 ， 
这 甚至 还 没有 考虑 外 部 存储 器 。 因 此 ,我 们 永远 无 法 知道 TOY-8 可 以 做 什么 (当然 ， 绝 大 多 
数 TOY-8 程序 将 永远 不 会 真实 存在 )。 

TOY-8 的 意义 在 于 展现 一 款 与 TOY 具有 几 乎 完全 相同 特性 的 完整 机 器 ， 只 是 各 类 资源 
都 少 了 一 些 。 我 们 设计 TOY-8 的 目的 是 为 了 能 够 展示 一 个 包含 TOY (其 实 其 他 计算 机 也 几 
乎 一 样 ) 所 有 基本 元 素 的 计算 机 的 完整 电路 。 通 过 了 解 TOY 编程 的 特点 ， 可 以 理解 TOY-64 
等 计算 机 上 的 程序 以 及 你 自己 的 计算 机 程序 的 运行 情况 。 通 过 了 解 TOY-8 如 何 构 建 ， 可 以 
想象 出 如 何 构建 TOY、TOY-64 以 及 你 自己 的 计算 机 。 

上 面 表格 展示 了 这 一 系列 虚拟 计算 机 的 各 种 参数 。 当 然 ， TOY 和 TOY-64 之 间 还 有 很 
大 差距 ， 因 为 我 们 没有 详尽 分 析 32 位 计算 机 的 所 有 特性 ， 而 这 些 特性 是 在 过 去 的 几 十 年 中 
随 着 32 位 计算 机 的 广泛 使 用 不 断 丰 富 起 来 的 。 我 们 会 在 练习 中 涉及 更 多 相关 信息 。 

虚拟 内 存 。 看 起 来 TOY 最 大 的 限制 之 一 就 是 它 的 内 存 有 限 ， 所 以 你 可 能 会 想 知道 如 何 
模拟 比 我 们 实际 机 器 上 的 内 存 更 多 的 内 存 。 这 个 问题 很 早 就 被 解决 了 ， 因 为 内 存 的 成 本 一 直 
很 高 ， 我 们 总 是 没有 足够 的 内 存 可 以 使 用 。 使 用 纸 带 有 点 难以 想象 ， 但 是 在 很 短 的 时 间 内 ， 
磁带 和 磁盘 就 出 现 了 ， 并 可 以 提供 大 量 的 外 部 存储 器 。 有 了 这 样 的 设备 ， 虚 拟 内 存 (virtual 
memory) 的 想法 很 快 就 出 现 了 。 大 多 数 程 序 在 给 定 的 时 间 只 能 处 理 相对 较 小 的 内 存 区 域 ， 
因此 程序 可 以 访问 大 型 虚拟 内 存 ， 而 实际 上 虚拟 内 存 大 部 分 是 驻 留 在 外 部 存储 上 的 。 操 作 系 
统 的 工作 是 确保 程序 需要 访问 的 内 存 部 分 在 适当 的 时 间 被 放 到 实际 的 内 存 ， 以 保证 程序 可 以 
访问 到 它们 。 在 这 种 情况 下 ， 可 用 的 实际 内 存 越 多 ， 程 序 越 能 更 好 地 工作 ， 毕 竞 在 实际 内 存 
和 外 部 存储 间 的 交互 越 少 ， 性 能 会 越 高 。 

向 后 兼容 。 我 们 今天 所 使 用 的 大 量 软 件 ， 是 很 久之 前 在 一 台 功 能 更 少 的 机 器 上 写 就 的 ， 
并 经 过 了 很 多 代 的 更 新 。 这 是 个 令 人 瞩目 的 事实 。 事 实 上 ,关于 软件 ， 除 去 它 提 供 的 功能 之 
外 ， 人 们 对 于 它 一 无 所 知 。 当 你 购买 一 台新 计算 机 时 ， 你 使 用 的 软件 只 有 一 小 部 分 是 为 那 台 
计算 机 编写 的 ， 剩 余 的 软件 均 来 自 以 前 的 开发 成 果 。 这 极 大 地 加 快 了 进度 : 如 果 虚 拟 机 能 够 
工作 ,那么 所 有 的 软件 都 能 正常 工作 ! 但 过 了 一 段 时 间 ， 可 能 会 出 现 一 些 意 想 不 到 的 问题 。 
一 个 著名 的 例子 就 是 Y2K 问题 ， 即 公元 2000 年 前 开发 的 各 种 旧 软 件 系统 必须 在 跨 千 年 的 时 
候 重 写 ， 因 为 它们 仅 用 两 位 数字 代表 年 份 (的 后 两 位 )， 导 致 出 现 各 种 未 预想 到 的 后 果 ， 如 
年 龄 可 能 变 成 负 值 等 。 
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服务 器 农场 。 为 什么 只 使 用 一 台 计 算 机 来 完成 计算 任务 ? 我 们 在 程序 6.4.1 中 实现 的 TOY 
只 是 一 种 数据 类 型 ， 所 以 我 们 可 以 很 容易 地 编写 一 个 客户 程序 ， 可 以 创建 一 千 或 一 百 万 个 TOY 
计算 机 并 运行 它们 。 现 代 云 计算 使 得 它们 可 以 在 由 大 量 实际 处 理 器 组 成 的 服务 器 农场 中 同时 
运行 。 实 际 上 ， 越 来 越 多 重要 的 计算 应 用 需要 在 一 个 服务 器 农场 的 虚拟 机 环境 中 运行 。 当 你 
用 移动 设备 识别 语音 或 增强 照片 时 ， 很 可 能 是 服务 器 农场 中 的 虚拟 机 帮助 你 完成 了 这 项 工作 。 
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一 个 TOY-64 服务 器 农场 


我 们 设计 了 一 台 虚 拟 计算 机 ， 当 然 这 个 过 程 对 于 已 经 设计 完成 的 计算 机 设备 没什么 贡献 。 
但 是 这 台 计 算 机 足够 简单 ， 可 以 使 我 们 更 好 地 理解 计算 的 本 质 ， 从 而 对 我 们 在 第 5 章 中 学 习 的 基 
本 理论 问题 形成 更 深刻 的 理解 。 计 算 机 究竟 是 什么 ? 计算 机 程序 究 竞 是 什么 ? 计算 机 的 哪些 方 
面体 现 了 它 的 本 质 ? 有 没有 新 的 计算 方法 可 以 显著 提高 我 们 的 计算 能 力 ? 仿真 似乎 能 够 将 如 此 
广泛 的 各 种 不 同 的 计算 设备 整合 到 统一 的 整体 中 ， 是 否 对 其 存在 一 些 基 本 的 解释 ? 要 找到 这 些 
问题 的 答案 ， 你 可 以 从 安装 器 、 解 释 器 、 编 译 器 和 其 他 类 似 的 处 理 程序 的 程序 中 找到 一 些 启示 。 

最 后 ， 我 们 需要 通过 研究 如 何 设计 和 实现 它 的 电路 来 揭 开 TOY 本 身 的 神秘 面纱 。 这 是 
下 一 章 的 主题 。 
问答 环节 

问 : 为 什么 不 在 程序 6.4.1 中 使 用 short 类 型 的 数组 来 定义 RED] 和 MI[] ? 它们 只 有 16 位 ， 
与 short 类 型 是 一 致 的 。 

答 : 在 使 用 算术 运算 符 时 ，Java 会 将 short 值 补充 完整 为 int 值 ， 因 此 这 么 做 没有 必要 。 
但 是 ,我们 有 时 候 需 要 用 0xFF 来 对 int 型 进行 取 掩 码 得 到 一 个 16 位 的 值 ， 以 便 模拟 一 个 
short 值 的 行为 。 

问 : 如 果 将 PC 设置 为 FF, 会 发 生 什 么 情况 ? 在 FF 中 是 什么 值 ? 

答 : 当然 ,我 们 可 以 为 这 个 操作 定义 我 们 想 要 的 任何 行为 ， 但 要 回答 这 些 问题 ， 必 须 
研究 程序 6.4.1 的 代码 ， 因 为 这 是 TOY 的 定义 。 显 然 ，M[FF] 最 初 是 零 ， 但 是 它 保 存 了 用 
stdin() 读 取 或 用 stdout() 写 人 的 最 后 一 个 值 。 当 然 ， 某 些 黑客 可 能 会 利用 这 一 行为 ! 因此 最 
好 在 stdin() 和 stdout() 的 实现 中 将 其 设置 为 零 ， 这 样 当 PC 跳 转 到 0xff 时 机 器 会 停机 。 
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和 代 6 苹 


问 : TOY 是 否 通用 (是 否 等 价 于 图 灵机 ) ? 
答 : 并 不 完全 是 的 。 如 我 们 所 定义 的 那样 ， 用 读 写 双 向 纸 带 取代 纸 带 打 孔 器 和 读 取 器 就 
可 以 了 。 事实 上 ,这 也 是 许多 旧 计 算 机 第 一 次 升级 的 项 目 之 一 。 


练习 


6.4.1 
6.4.2 


6.4.3 


本 章 末 尾 描 述 的 TOY-64 服务 器 农场 中 有 和 多少 字 节 的 内 存 ? 
实现 TOY.java 的 main() 方法 (程序 6.4.1 )。 
答案 : 
public static void main(String[] args) 
{ 
String filename = args[0]; 
int pc = Integer.parseInt(args[1], 16); 
TOY toy = new TOY(filename, pc); 


toy.run() ; 
} 


为 TOY.java 添加 一 个 命令 行 参数 ， 表 示 一 个 内 存 地 址 和 一 个 寄存 器 号 ,然后 添加 代码 ， 使 得 每 
次 执行 这 个 内 存 地 址 的 指令 之 前 ( 即 PC 取 这 一 参数 值 )， 将 指定 寄存 器 的 内 容 打印 出 来 。 如 果 
参数 为 0， 则 以 正文 中 形式 (在 5.3.1 节 的 开头 处 ) 打印 程序 结束 时 内 存 的 内 容 。 

为 模拟 穿孔 纸 带 的 TOYjava 开发 stdin() 和 stdout() : 每 个 16 位 值 表 示 为 两 行 ， 每 行 8 个 字符 ， 
其 中 “0” 用 空格 表示 ,“1” 用 “*” 表 示 。 

修改 TOY.java 用 乘法 指令 替换 减法 指令 。 请 注意 两 个 16 位 整数 相 乘 的 结果 是 一 个 32 位 整数 。 
修改 TOY.java 以 支持 一 个 216 字 的 TOY 内 存 ， 并 将 每 个 内 存 相 关 指 令 的 含义 改 为 间接 指令 ， 
其 访问 的 目标 地 址 放 在 前 256 个 内 存 字 中 。 例 如 ;指令 8A23 会 将 M[23] 中 的 内 容 当 作 地 址 ， 
从 内 存 中 加 载 一 个 字 长 到 R[A] 中 。 为 这 台 机 器 实现 一 个 sum.toy， 用 于 实现 10 000 个 16 位 二 
进 制 补 码 值 的 求 和 计算 。 


创新 练习 


6.4.7 


6.4.8 


6.4.9 


6.4.10 


6.4.11 


单 寄 存 器 机 器 。 设 计 一 个 16 位 计算 机 ， 使 其 具有 一 个 寄存 器 、16 条 指令 和 4096 个 字 的 存储 器 。 
对 于 每 个 双 操 作 数 指令 ， 一 个 操作 数 放 在 寄存 器 中 ， 另 一 个 放 在 存储 器 中 ， 并 将 结果 留 在 寄存 
器 中 。 为 你 的 机 器 写 一 个 模拟 器 。 
虚拟 内 存 。 假 设 机 器 有 一 个 新 的 外 部 存储 设备 ， 有 232 个 可 寻 址 的 32 位 字 ， 并 且 它 与 TOY 相 
连接 实现 了 一 个 虚拟 内 存 ， 如 下 所 示 : 对 FF 的 两 个 连续 写 人 提供 一 个 32 位 地 址 ， 然 后 ， 如 果 
接 下 来 的 两 个 指令 是 对 FF 的 存储 指令 (或 间接 存储 指令 )， 则 它们 等 同 于 向 该 地 址 写 入 一 个 32 
位 值 ; 如 果 接 下 来 的 两 个 指令 是 对 FF 的 加 载 指令 (或 间接 加 载 指令 )， 则 它们 等 同 于 从 该 地 址 
读 取 一 个 32 位 值 。 写 一 个 sum.toy 的 版 本 ， 可 以 为 一 百 万 个 32 位 二 进 制 补 码 值 求 和 。 
并 行 TOY。 修 改 TOY.java 从 命令 行 取 整 数 n， 然 后 模拟 一 台 维 护 n 个 PC 的 机 器 ， 编 号 分 别 为 
从 0 到 n-1。 机 器 在 每 个 周期 内 同时 对 所 有 PC 模拟 其 提取 - 递增 - 执行 的 过 程 。 如 果 一 个 周 
期 中 两 个 PC 要 求 对 同一 个 寄存 器 进行 不 同 的 更 改 ， 则 索引 较 低 的 PC 优先 。 
TOY 中 的 TOY。 在 TOY 中 开发 一 个 实现 TOY 虚拟 机 的 程序 TOYtoy。 首 先 假定 机 器 有 32 个 
字 的 内 存 、8 个 寄存 器 且 没 有 标准 输入 /输出 。 可 以 使 用 其 余 的 内 存 (和 标准 输入 /输出 ) 来 
开发 你 的 程序 。 然 后 为 其 添加 标准 输入 /输出 、 更 多 的 内 存 和 更 多 的 寄存 器 ， 以 便 可 以 运行 
6.3 节 中 的 所 有 程序 。 
字符 串 TOY。 为 一 个 假想 的 16 位 字符 串 处 理 机 器 设计 和 构建 一 个 模拟 器 ， 它 具有 与 TOY 相 


6.4.12 


6.4.13 


6.4.14 
6.4.15 


6.4.16 


6.4.17 


6.4.18 
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同 的 寄存 器 和 内 存 ， 但 是 具有 字符 串 处 理 操作 。 假 定 字 符 串 被 存储 为 一 个 内 存 字 的 序列 ， 每 
个 字 用 于 存储 两 个 ASCII 字符 ， 以 00 结尾 。 该 计算 机 应 支持 字符 串 搜 索 、 子 串 提取 和 标准 输 
入 /输出 操作 。 编 写 一 个 程序 来 使 用 插入 排序 以 排序 一 个 字符 串 数组 (数组 中 的 每 个 元 素 是 一 
个 字符 串 的 引用 )。 

性 能 。TOY 比 Java 更 快 吗 ? 分 别 用 TOY 程序 和 Java 程序 实现 一 个 使 用 BST 为 随机 的 16 位 
整数 去 重 的 功能 ， 运 行 倍速 测试 来 观察 两 个 程序 的 运行 时 间 加 速 比率 的 差异 。 

汇编 器 。 编 写 一 个 Java 程序 ， 用 于 处 理由 汇编 语言 编写 的 TOY 程序 (汇编 语言 是 比 机 器 指令 
稍微 高 级 一 些 的 编程 语言 ); 并 输出 一 个 TOY 程序 ， 采用 的 格式 应 适合 于 正文 中 给 出 的 引导 
程序 所 需 的 格式 。 汇 编 语 言 可 以 为 地 址 、 操 作 码 和 寄存 器 定义 符号 名 称 。 例 如， 以 下 是 程序 
6.3.4 的 汇编 语言 版 本 (在 标准 输出 上 打出 斐 波 那 契 数列 ); 


LA one, 1 

LA a，0 

LAb,1 

We 
loop BZ i, done 

ST a, stdout 


在 实现 汇编 器 时 ， 你 应 该 在 汇编 语言 代码 和 TOY 指令 之 间 保 持 一 对 一 的 对 应 关系 。 其 他 具体 
细节 由 你 来 实现 。 汇 编 语言 相对 于 机 器 语言 的 一 大 优点 是 程序 可 以 在 任何 地 方 加 载 (程序 中 的 
地 址 由 汇编 器 来 计算 )， 因 此 程序 应 该 将 起 始 地 址 作为 命令 行 参 数 。 
表达 式 编 译 器 。 修 改 Dijkstra 算法 (程序 4.3.5 ) 输出 一 个 可 以 计算 给 定 表 达 式 的 TOY 程序 。 
表达 式 解 释 器 。 开 发 Dijkstra 算法 (程序 4.3.5 ) 的 TOY 实现 ， 栈 过 平方 根 函 数 。 假 设 输入 表 
达 式 在 标准 输入 上 满足 : 所 有 操作 数 都 是 非 负 的 15 位 无 符号 数 ， 使 用 负数 来 表示 运算 符 和 分 
隔 符 ， 如 8001 代表 “+”、8002 代表 “=-” 8003 代表 “*”、8004 代表 “/”、8005 代表 “( ”， 
8006 代表 “)”。 栈 的 实现 参考 练习 6.3.25， 乘 法 运算 实现 参考 练习 6.3.35。 
32 位 TOY。 设 计 一 个 32 位 的 TOY 计算 机 。 论 证 你 所 做 的 每 一 个 设计 选择 的 合理 性 。 为 你 的 
TOY-32 设计 实施 一 个 虚拟 机 。 10: 7AEE x 
弹跳 球 。 开 发 一 个 TOY 程序， 为 一 台 绘 图 机 产生 指令 。 具 体 i 疆 Ye 
来 说 ,假设 一 个 采用 16 位 命令 的 绘图 机 的 指令 格式 是 : 第 一 13: 7c32 
个 十 六 进 制 数字 是 操作 码 (4 位 二 进 制 数 ) ; 后 面 的 数字 是 参 1 95FF 22 
数 信息 。 对 于 这 个 练习 ， 我 们 只 关注 两 个 操作 码 : 0 操作 码 将 ”16: 1AA1l x+= dx 
一 个 字 中 剩余 的 12 位 值 推进 栈 中 ，1 操作 码 从 栈 中 弹出 三 个 17: 8315 R[3] = mask 
12 位 值 ( 分 别 是 r、y、x)， 然 后 绘制 一 个 以 (x，y) 为 中 心 、 1A: 9AFF push x 

1B: 871D R[7] = instruction 


r 为 半径 的 圆 。 例 如 ， 右 侧 的 代码 会 在 标准 输出 上 产生 一 系列 1C: 97FF push instruction 
指令 ， 可 以 用 来 指示 设备 绘制 一 个 移动 的 球 (从 左 到 右 移动 ， 1D: C5014 Yoop 


遇 到 右边 界 后 弹 回 到 左边 )。 参 照 程序 1.5.6， 扩 展 这 个 程序 FE: dp 
来 产生 绘制 弹跳 球 的 指令 。 为 绘图 设备 创建 指令 


虚拟 绘图 机 。 编 写 一 个 Java 程序 DrawingTOY.java， 它 使 用 StdDraw 来 模拟 上 一 个 练习 中 描 
述 的 绘图 设备 ， 以 生成 指定 的 动画 。 扩 展 机 器 以 支持 正方 形 、 线 条 和 和 多边形 ， 然 后 编写 TOY 
代码 以 生成 有 趣 的 图 形 设计 。 
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如 果 要 设计 一 个 计算 机 处 理 器 ， 你 可 能 会 想 ， 这 需要 一 支 受过 最 专业 培训 的 高 级 人 才 队 
伍 。 虽 然 这 个 想法 有 些 道理 ， 但 是 自 第 一 台 计 算 机 以 来 ， 在 所 有 处 理 器 的 整体 架构 设计 的 过 
程 中 有 着 显著 的 简易 性 和 相似 性 ， 本 章 将 会 详细 地 讲述 一 台 特 殊 的 通用 计算 机 的 设计 过 程 。 
通过 讲述 计算 机 的 设计 ， 解释 “如 何 构 建 计算 机 ”“ 如 何 操作 计算 机 ”诸如 此 类 的 问题 。 

通常 ,我 们 可 以 将 计算 机 视 为 连接 到 输入 和 输出 设备 的 黑匣子 。 那么 里 面 是 什么 ? 如 
果 打 开 计 算 机 ， 你 可 能 会 看 到 一 些 通过 插入 电路 板 连接 在 一 起 的 模块 ， 它 们 中 的 大 部 分 的 作 
用 就 是 控制 输入 和 输出 设备 ， 其 中 一 个 模块 是 中 央 处 理 器 ( CPU)， 它 是 计算 机 的 心脏 、 思 
想 和 灵魂 ， 因 为 如 果 没 有 CPU 所 发 出 的 信号 ， 整 个 计算 机 将 无 法 工作 。 如 果 我 们 可 以 通过 
显微镜 看 到 CPU 的 内 部 结构 ， 你 会 看 到 它 基 本 上 就 是 一 个 由 若干 模块 连接 在 一 起 而 组 成 的 
内 部 网 络 。 这 和 早期 的 计算 机 有 很 大 的 不 同 ， 由 于 电池 和 电线 的 体积 较 大 ， 早 期 计算 机 甚至 
会 填 满 一 间 屋 子 。 

本 章 使 你 了 解 计算 机 如 何 工 作 ， 甚 至 可 以 自己 设计 一 台 计 算 机 。 如 同 计算 机 科学 中 的 许 
多 项 目 一 样 ， 你 需要 注意 细节 ， 但 计算 机 设计 的 概念 十 分 简单 ， 我 们 会 利用 一 种 抽象 的 思想 
来 解决 这 个 问题 。 


7.1 布尔 逻辑 


我 们 对 数学 函数 的 概念 已 经 很 熟悉 了 一 一 我 们 在 程序 的 执行 中 就 讨论 过 它们 。 布尔 函数 
也 是 将 参数 映射 到 一 个 值 的 数学 函数 ， 只 是 其 中 范围 (函数 参数 ) 和 值 域 (函数 值 ) 都 仅仅 
是 两 个 值 中 的 一 个 。 无 论 我 们 将 这 两 个 值 称 为 true 和 false、 是 和 和 否 ， 还 是 0 和 1， 概念 都 是 
一 样 的 。 布 尔 函 数 的 研究 被 称 为 布尔 逻辑 (Boolean logic)。 
布尔 逻辑 得 名 于 19 世纪 的 英国 数学 家 乔治 布尔 ( George Boole)。 从 那 以 后 ， 它 成 为 
逻辑 推理 的 基础 。 如 果 你 希望 对 布尔 逻辑 展开 深入 的 研究 ， 你 需要 另外 找 一 本 书 (研究 这 样 
一 本 书 或 者 就 这 个 问题 选修 一 门 课程 将 都 是 非常 有 价值 的 )。 在 本 节 中 ， 我 们 从 基础 理论 开 
始 ， 重 点 关注 与 计算 相关 的 概念 ， 特 别 是 数字 电路 的 实现 。 
我 们 在 本 书 中 遇 到 过 几 次 布尔 函数 。 这 里 只 举 几 个 例子 : 
。 第 1 章 介绍 了 Java 的 布尔 值 数据 类 型 ， 并 立即 学 会 在 程序 
中 的 让 和 while 语句 中 使 用 它 来 实现 决策 。 
。 在 第 5 章 中 ,我 们 考虑 了 布尔 可 满足 性 问题 在 计算 理论 中 
的 关键 作用 。 
。 在 第 6 章 中 ， 我 们 看 到 了 布尔 函数 在 对 信息 进行 二 进 制 表 
示 时 的 实用 性 。 
由 于 它 的 重要 性 ， 我 们 在 本 节 中 加 入 了 “前 文 索引 ”， 所 以 
如 果 你 只 看 了 本 章 ， 而 没有 阅读 本 书 的 其 余部 分 ， 也 不 会 有 问题 ， 因 为 涉及 的 前 文中 的 基本 
信息 并 不 难 理解 ， 你 仅 阅读 本 章 也 不 影响 你 掌握 其 中 的 知识 。 我 们 之 所 以 选择 这 种 非 线性 结 
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构 ， 是 因为 布尔 函数 和 执行 计算 任务 的 电路 之 间 存 在 的 密切 联系 。 这 是 一 个 基础 的 概念 ， 我 
们 基于 它 发 展 出 了 今天 所 用 的 计算 机 基础 设施 。 本 章 希 望 你 重点 关注 于 布尔 函数 和 电路 的 关 
系 ， 同 时 更 好 地 了 解 布 尔 对 数学 的 伟大 贡献 。 他 完全 没有 料 到 他 的 工作 将 在 两 个 世纪 后 作为 
计算 的 基础 。 理 解 布尔 函数 和 电路 的 关系 等 同 于 理解 “电路 如 何 计算 ”的 问题 。 

布尔 函数 ”你 所 熟悉 的 布尔 函数 包括 非 、 或 、 与 的 基本 功能 ， 所 以 我 们 从 它们 开始 。 要 
定义 任何 布尔 函数 ， 我 们 只 需要 为 其 每 个 可 能 的 输入 值 确定 其 输出 值 。 在 本 节 中 ， 我们 使 用 
0 和 1 表示 布尔 值 。 我 们 使 用 布尔 变量 ( boolean variable) 在 符号 表达 式 中 表示 布尔 值 。 例 
如 ，not 函数 是 一 个 布尔 变量 的 函数 ， 定 义 如 下 : 
0 如 果 7 是 1 
1 如 果 x 是 0 
类 似 地 ,包含 两 个 变量 的 函数 与 (and)、 或 (or)、 异 或 (exclusive or) 定义 如 下 : 

0 ”如 果 x 或 (或 两 者 ) 为 0 
apeen = 如 果 工 和 》 均 为 


“fo 如果 和沙 均 为 0 
ogy-| 如 果 x 和 (或 两 者 ) 为 1 


0 如 果 x 或 相同 
xoRGe -| 如 果 x 和 不 同 
直观 地 理解 这 些 定义 的 一 个 方法 是 将 x 和 yy 解释 为 逻辑 命题 ， 如 “天 空 是 蓝 色 的 ”或 
“太阳 照耀 着 大 地 ”， 然 后 将 工 解释 为 真 ， 将 0 解释 为 假 ; 例如 ， 如 果 * 和 yy 都 为 tue， 则 
AND (x, y) 为 true， 否则 为 false， 这 恰好 支持 了 我 们 的 直觉 ， 即 “天 空 是 蓝 色 的 ， 并 且 太 
阳 照 炮 着 大 地 ”这 样 的 语句 只 有 在 命题 的 两 个 部 分 都 是 真实 的 ， 才 能 判定 为 真 。 在 数学 定 
理 中 ， 如 果 x 是 “整数 vy 大 于 或 等 于 0” 的 命题 , y 是 “整数 vy 小 于 或 等 于 0” 的 命题 ， 则 
AND (x, y) 为 真 也 就 是 说 v 等 于 0 (符合 有 关 整 数 的 相关 公理 )。 这 种 应 用 是 布尔 研究 这 些 
功能 的 动机 。 
表示 形式 。 在 近 两 个 世纪 中 ， 布 尔 逻 辑 已 经 在 多 个 领域 发 挥 了 重要 的 作用 ， 因 此 对 于 基 
本 操作 也 出 现 了 许多 不 同 的 表示 形式 。 我 们 已 经 在 本 书 遇 到 了 一 些 。 在 本 章 中 ,我 们 使 用 z 
表示 NOT (x), 用 区 表 示 AND (x, y),， 用 x +y 表 示 OR (x,，y)。 用 乘法 来 表示 “与 ” 操 
作 与 我 们 之 前 的 认 知 相符 ， 但 是 用 加 法 表示 “或 ”操作 会 有 一 个 特殊 的 表达 式 : 1 + 1 = 1。 
我 们 在 本 章 中 会 经 常 使 用 它 ， 但 是 为 了 防止 混淆 ,我 们 在 以 下 表格 中 总 结 了 所 有 的 表达 式 。 


wor -| 


逻辑 Java 布 尔 值 Java 位 运算 电路 设计 
NOT =X Ix ~X We 
AND XAy X && y XxX&y xy 
OR XVYy X /1 y 让 米 X+y 
XOR X 四 y 人 X 人 Y XBy 
基本 的 布尔 函数 表达 式 


真 值 表 。 我 们 已 经 注意 到 ， 定 义 布尔 函数 的 一 种 方法 是 为 输入 参数 的 每 种 可 能 情况 定 
义 其 输出 值 。 这 样 的 数据 的 一 种 有 效 组 织 形式 是 真 值 表 。 在 一 个 真 值 表 中 ， 每 个 变量 对 应 一 
列 ， 变 量 值 组 合 的 一 种 可 能 情况 对 应 一 行 ， 最 后 一 列 用 于 该 变量 组 合 对 应 的 函数 值 。 例 如 ， 
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下 面 列 出 了 一 些 基本 函数 的 真 值 表 定 义 : 








~ [~) [~ » 
[~ ~ (~—) je 
~ 六 ~ SS 
上 上 SS SS bed 


| 
基本 布尔 函数 的 真 值 表 


有 个 变量 的 函数 ， 它 的 真 值 表 有 2 行 ， 所 以 我 们 不 能 用 真 值 表 表 示 过 多 的 值 。 如 下 
图 所 示 ， 我 们 使 用 真 值 表 不 仅仅 是 定义 函数 ， 还 可 以 验证 它们 的 各 种 操作 和 应 用 的 有 效 性 ， 
因为 它们 为 我 们 提供 了 一 种 系统 的 方式 来 检查 所 有 的 可 能 性 。 
两 个 变量 正好 有 16 种 布尔 函数 ， 所 以 我 们 可 以 枚 举 它们 ， 如 下 表 所 示 : 











ns a A yy XOR OR NOR EQ y’ XE NAND / 

人 芝 了 

a" Ww "A 1 

£ Wl ER Wi 0 Li a 0 2 1 

人 0 了 
两 个 变量 的 所 有 布尔 函数 


我 们 经 常 在 数学 逻辑 、 数 字 电路 设计 的 过 程 中 遇 到 这 些 函 数 ， 甚 至 没有 标记 的 那 几 列 也 
属于 常见 的 操作 〈 见 练习 7.2.2)。 特别 要 说 明 的 是 ， 你 需要 注意 NOR (NOT OR)、NAND 
(NOTAND) 和 xy' (AND NOT) 的 真 值 表 。 

布尔 代数 。 布 尔 运 算 符 ( boolean operator) 是 表示 布尔 函数 的 符号 ; 布尔 代数 是 指 由 布 
尔 变 量 和 布尔 运算 符 组 成 的 表达 式 的 符号 操作 。 你 将 看 到 ， 布 尔 代数 最 大 的 限制 就 是 变量 取 
值 只 能 为 0 和 1， 这 使 得 布尔 代数 与 你 在 中 学 学 到 的 实数 代数 不 同 (也 简单 得 多 ), 但 也 有 很 
多 相似 之 处 。 

代数 作为 广义 数学 的 研究 对 象 ， 是 一 个 普遍 的 概念 ， 它 也 是 一 个 更 高 级 别 的 主题 ,已 经 
超过 了 我 们 研究 的 范围 。 对 于 布尔 代数 ,我们 首先 给 出 对 公理 (公认 的 事实 ) 的 严谨 定义 ， 
然后 在 它 的 基础 上 从 逻辑 上 推断 布尔 函数 的 一 些 定理 和 公式 。 为 了 表达 方便 ， 我 们 将 公理 、 
公式 和 定理 都 称 为 “定律 "， 你 可 以 利用 其 中 的 任何 一 个 。 布 尔 代数 的 基本 定律 的 定义 非常 
简单 ， 其 中 有 很 多 你 都 很 熟悉 。 在 代数 中 常用 到 的 交换 律 、 分 配 律 和 结合 律 在 布尔 代数 中 仍 
然 适用 ， 如 下 表 所 示 。 此 外 ， 很 多 其 他 仅 适 用 于 布尔 代数 的 定律 也 很 容易 证 明 。 例 如 ， 表 中 

的 最 后 一 项 给 出 了 NAND 和 NOR 函数 的 两 个 特殊 等 式 , 我 们 称 之 为 德 ， 摩 根 定律 。 
公理 


JIX 王 X 

恒等式 污 订 区 :mi 

推论 sj 

XX 1 

a XY YN 
交换 律 x 


布尔 代数 的 基本 定律 
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NT 和 X(Yy + ZJ) = Xxy + XZ 
分 配 律 yp ir le 
结合 律 (XYy)z = x(yz) 
-0 人 
公式 和 定理 
a 0 = 1 
取 反 多 
双重 否定 EX 
Ox = 0 
SE rr | 
i LAG 2 ts 
吸收 律 "ee 
德 . 摩根 定律 G00 入 = 皆 选 着 
GE = XY 
布尔 代数 的 基本 定律 ( 续 ) [550| 


所 有 这 些 定律 都 很 容易 建立 真 值 表 。 我 们 在 1.2 节 的 一 个 例子 中 已 经 使 用 过 这 种 方法 。 
由 于 它们 的 重要 性 ， 我 们 使 用 本 章 的 符号 来 重新 表述 德 ， 摩根 定律 的 真 值 表 : 





NAND NOR 
xXy WO Wy x Xm yy! my’ 
QWid ni i a 00 0 1 0 
Oa ds 贡 Qa i sa sd mc 0 OO 人 
J Or A Lu L sz A ! 0 0 
Ni, Va | ra 浊 0 Ly 


证 明 德 . 摩根 定律 的 真 值 表 


Java 中 的 布尔 代数 。 你 可 能 已 经 意识 到 了 ，Java 程序 中 的 布尔 代数 有 两 种 不 同 的 形式 。 
两 者 之 间 的 区 别 是 新 手 混乱 的 原因 (也 常 是 教师 考试 题材 的 来 源 )， 所 以 值得 研究 。 

。 Java 的 布尔 数据 类 型 : 在 1.2 节 中 ,我 们 引入 了 布尔 类 型 ( 取 值 范围 为 true 和 false) 
和 布尔 运算 ， 分 别 使 用 运算 符 && 、|、! 进行 AND、OR 和 NOT 运算 。 自 此 以 来 ， 
我 们 一 直 使 用 布尔 表达 式 来 控制 程序 中 的 执行 流程 ， 其 中 布尔 表达 式 可 以 包括 类 型 为 
boolean 的 变量 、 这 些 布尔 操作 符 ， 以 及 可 以 返回 布尔 值 的 其 他 各 类 运算 符 。Java 支 
持 任意 的 布尔 表达 式 ， 如 我 们 的 第 一 个 示例 LeapYear (程序 1.2.4 ) 所 示 ， 但 是 其 余 
程序 几乎 在 所 有 情况 下 都 使 用 了 尽 可 能 简单 的 表达 式 。 
整数 值 的 按 位 操作 : 在 6.1 节 中 ， 我 们 讨论 了 Java 的 按 位 操作 ， 分 别 使 用 运算 符 
&&、 上、! 和 ^ 对 整数 值 的 二 进 制 表示 形式 的 每 一 位 进行 AND、OR、NOT 和 XOR 
运算 。Java 文 持 任意 形式 的 按 位 操作 表达 式 ， 这 一 点 对 我 们 处 理 数据 的 单个 位 很 有 
帮助 。 在 虚拟 机 TOY (程序 6.4.1 ) 中 可 以 看 到 各 式 各 样 的 应 用 。 

每 一 个 程序 员 在 使 用 布尔 代数 时 可 能 会 用 到 以 上 两 种 方式 的 任何 一 种 ， 这 些 操 作 在 现代 
编程 语言 中 是 一 个 重要 的 组 成 部 分 。 991 

应 用 实例 下 面 我 们 来 分 析 一 个 加 密 的 应 用 程序 ， 这 是 把 上 述 概念 付 诸 实践 的 一 个 具体 
实例 。 

密码 学 中 的 根本 问题 是 ， 发 送 者 (sender) 需要 以 窃听 者 (eavesdropper) 不 能 够 读 取 的 
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方式 ， 向 接收 者 ( receiver) 发 送 秘密 消息 。 为 此 ， 一 种 简单 的 配置 是 发 送 者 使 用 加 密 设 备 
(encryption device) 来 创建 密 文 (将 要 传递 的 信息 编码 后 得 到 ) 并 传输 ， 而 接收 者 则 使 用 解 
密 设 备 ( decryption device) 对 其 进行 解码 。 密 码 系 统 ( cryptosystem) 即 是 解决 这 类 问题 的 
协议 。 

“一 个 基本 的 密码 系统 ”图 示 了 一 个 基本 的 密码 系统 。 它 基于 使 用 密 钥 加 密 的 方法 来 实 
现 安全 通信 。 这 个 方法 让 发 送 者 和 接收 者 通过 一 些 安全 机 制 提前 交换 密 钥 ， 以 便 发 件 人 可 以 
使 用 密 钥 加 密 消息 ， 而 接收 者 可 以 使 用 相同 的 密 钥 对 其 进行 解密 。 例 如 ， 在 20 世纪 的 世界 
大 战 中 ， 指 挥 官 和 船长 将 采用 与 总 部 使 用 相同 的 “密码 本 ”， 每 天 都 会 有 当天 的 密 钥 ， 以 应 
用 于 当天 的 安全 通信 。 

一 种 特别 简单 的 加 密 /解密 方法 即 是 布尔 逻辑 的 直接 运用 。 要 发 送 消息 ， 先 将 其 转换 为 
二 进 制 字符 串 ， 然 后 通过 使 用 按 位 异 或 操作 (XOR) 加 密 以 形成 密 文 ,下 所 示 : 


消息 S E C R E T 
消息 (二进制 ) m 010100110100010101000011010100100100010101010100 
密 铂 k 110010010011110110111001011010111001100010111111 


密 文 m®@k 100110100111100011111010001110011101110111101011 


加 密 密 钥 只 是 一 个 与 消息 等 长 的 字符 串 。 当 然 ， 加 密 “ 设 备 ” 现 在 只 是 一 个 程序 ， 并且 
编写 一 个 Java 程序 ， 以 用 于 在 任意 长 的 两 个 二 进 制 位 序列 上 执行 这 个 计算 来 产生 一 个 密 文 ， 
这 并 不 是 一 个 复杂 的 任务 〈 见 练习 7.1.18 )。 如 果 密 钥 的 位 是 随机 选择 的 ， 则 密 文 不 能 被 窃 
听 者 理解 (其 位 也 是 随机 的 )。 密 码 系统 的 安全 性 能 高 低 取决 于 密 钥 随机 的 程度 一 密码 学 
的 科学 性 和 艺术 性 即 在 于 贡献 尽 可 能 多 的 随机 性 的 密 钥 ， 以 达到 窃听 者 即便 在 满 屋 的 超级 计 
算 机 的 帮助 下 也 无 法 解密 的 程度 。 








窃听 者 的 破解 
超级 计算 机 


秘密 消息 









pe af 1 在 安全 信道 上 进 
a 行 私密 数据 交换 


一 个 基本 的 密码 系统 


但 是 接收 方 如 何 解 密 该 消息 呢 ? 你 可 能 会 惊讶 地 发 现 ， 使 用 相同 的 密 钥 ,接收 方 解 密 消 
息 与 发 送 者 加 密 消 息 的 过 程 是 一 样 的 : 


消息 c 100110100111100011111010001110011101110111101011 

密 铀 k 110010010011110110111001011010111001100010111111 

消息 ( 二进制) c@k 010100110100010101000011010100100100010101010100 
S E R E T 


这 个 过 程 乍 一 看 似乎 很 神奇 ， 但 是 我 们 可 以 证 明 : (c 多 有 =((m 甸 有田 有 =m ， 从 而 能 够 
理解 它 的 原理 。 这 些 是 对 消息 的 每 一 位 执行 的 操作 ， 因 此 接收 者 也 需要 对 每 一 位 进行 恢复 。 

我 们 当然 可 以 通过 真 值 表 来 证 明 这 种 方法 的 正确 性 (参见 练习 7.1.4 )， 但 它 是 一 个 用 来 
说 明 布尔 代数 法 的 很 好 的 例子 ， 我 们 无 须 诉 诸 真 值 表 即 可 证 明 这 种 正确 性 。 下 表 给 出 了 证 明 
上 述 表 达 式 正确 性 所 需 的 代数 定义 和 定律 : 
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定义 X@Yy = XY + Xx'y 
恒 等 律 x@0= x 
归 零 律 X BX ‘= 0 


结合 律 (OY Bz=x@(y@2 


恒 等 律 、 归 零 律 和 结合 律 很 容易 从 前 文 的 布尔 代数 的 定义 和 基本 定律 中 得 到 证 明 ( 见 练 
习 7.1.5 )。 根 据 这 些 定律 ， 我 们 的 证 明 过 程 就 变 得 很 简单 ; 


(m@ kj@k = mege(ke@Ak 结合 律 
= me®@0 归 零 律 
= 崩 恒 等 律 


这 种 非常 简单 的 机 制 已 经 被 广泛 应 用 了 很 长 时 间 ， 并 且 在 现代 系统 中 仍然 被 广泛 使 用 。 
当然 ， 现 在 的 人 们 很 少 依赖 可 信 的 信使 进行 密 钥 交换 一 现代 密码 学 基于 更 复杂 和 更 方便 的 
密 钥 分 发 方法 (最 广泛 使 用 的 方法 被 称 为 RSA， 这 是 一 种 基于 因 式 分 解困 难 性 的 技术 )。 当 
然 ， 产 生 “ 随 机 ” 密 钥 仍 然 是 一 个 热门 的 研究 课题 (简单 的 例子 见 练习 7.1.15 )。 

这 个 应 用 程序 只 是 布尔 代数 效用 的 一 个 小 例子 。 然 而 ， 正 如 我 们 在 本 书 中 看 到 的 许多 数 
学 应 用 一 样 ， 这 证 明了 基础 研究 的 重要 性 。 近 两 个 世纪 前 ， 布 尔 为 了 自己 的 缘故 追求 知识 ， 
他 绝 没 有 想到 他 的 代数 对 我 们 理解 互联 网 商业 周边 的 密码 基础 设施 而 发 挥 的 作用 。 

三 个 或 更 多 个 变量 的 布尔 函数 “ 随 着 变量 数量 的 增加 ， 函 数 的 可 能 性 也 会 急剧 增加 。3 
个 变量 有 2: 个 不 同 的 函数 ，4 个 变量 有 28 个 函数 ，5 个 变量 有 2?2 个 函数 ，6 个 变量 有 2% 个 
函数 ， 等 等 。 我 们 可 以 从 这 些 数字 中 得 出 一 个 结论 ， 正 如 我 们 在 5.5 节 中 有 关 指数 增长 的 讨 
论 一 样 ， 当 布尔 函数 的 变量 数目 较 大 时 ， 其 中 的 绝 大 多 数 布尔 函数 可 能 我 们 都 不 会 遇 到 。 但 
是 有 几 个 这 样 的 函数 在 计算 和 电路 设计 中 起 着 至 关 重要 的 作用 ， 所 以 我 们 现在 来 讨论 一 下 。 

我 们 按照 两 个 参数 的 方式 可 以 很 自然 地 扩展 出 多 个 参数 的 AND 和 OR 函数 的 定义 : 

0 如 果 任 何 参数 为 0 


ANpeo an 如 果 所 有 参数 为 1 


167 如 果 所 有 参数 为 0 
oo an 如 果 任 何 参数 为 1 
在 AND 函数 的 真 值 表 中 ， 除 最 底部 以 外 的 所 有 值 均 为 0。 在 DR 函数 的 真 值 表 中 ， 除 
最 顶层 之 外 的 所 有 值 多 为 1。 


可 能 性 不 胜 枚 举 ， 事实 上 ， 布 尔 函 数 可 以 涵盖 我 们 能 够 想到 的 任何 计算 任务 。 例 如 ， 我 
们 可 以 定义 一 个 布尔 函数 PRIME (x1,…, az)， 当 且 仅 当 二 进 制 数 zi, xz, x3, …, xn 是 质数 时 ， 
这 个 函数 的 值 为 1。 或 者 ， 我 们 也 可 以 定义 一 个 布尔 函数 TOYi(x1,…, x,)， 函 数值 为 1 的 条 
件 是 ， 当 且 仅 当 一 个 操作 员 初 始 化 内 存 里 的 所 有 位 ， 在 xi, xz, x3, …, 如上 加 上 PC， 然 后 担 
下 RUN 键 ，TOY 机 停机 ， 并 且 前 面 那 块 控 制 板 上 从 右边 数 第 位 的 指示 灯亮 起 。 这 样 的 函 
数 的 定义 可 以 是 清晰 而 完整 的 ， 尽 管 它们 的 真 值 表 可 能 会 大 到 难以 想象 。 

下 面 我 们 讨论 在 数字 电路 设计 中 出 现 的 两 个 例子 : majority (MAJ) 函数 和 odd-parity 
(ODD) 函数 : . 
1 如 果 参 数 中 1 的 个 数 比 0 多 (不 包括 相等 的 情况 ) 
0 其 他 情况 
1 如 果 参 数 中 1 的 个 数 为 奇数 
0 其 他 情况 


MAJ(x,*, | 


人 DDE 性 ,=| 


3580 委 7 介 


这 些 函 数 与 AND 和 OR 一 样 是 无 序 的 (symmetric)， 即 它们 的 结果 不 依赖 于 它们 的 参 


数 的 顺序 。 


布尔 表达 式 。 与 两 个 变量 的 布尔 函数 一 样 ， 我们 可 以 使 用 一 个 真 值 表 来 指定 任何 布尔 
函数 变量 的 值 。 对 于 三 个 变量 ， 这 样 的 表 有 2 = 8 行 。 例 如 ， 这 里 是 给 出 三 个 变量 的 AND、 


OR、MAJ 和 ODD 函数 的 真 值 表 : 


0 


RR RO OO Olx 
RRO OPPRO Ol« 


< 
0 
1 
0 
4 
0 
. 
0 
1 


mRmO SoooDS 


AND(x,y,z) 


三 变量 的 布尔 函数 


HT RE ROSS 


OR(x,y,Zz) 


MAJ(x,y,z) 


mh kn © © 


ODD(x,y,z) 


0 


局 


对 于 具有 较 多 变量 的 函数 ， 用 这 种 表示 不 仅 麻烦 而 且 容 易 出 错 ， 我 们 可 以 从 图 表 中 看 出 
来 , n 个 变量 需要 2" 行 。 所 以 我 们 习惯 使 用 布尔 表达 式 来 定义 布尔 函数 。 我 们 不 难 证 明 以 下 


两 个 等 式 : 


AND(x1, *…, Xn) = XIX2 ** Xn 
OR(xi, 和 wy 3 ee 2 


从 布尔 代数 的 角度 来 说 ， 我 们 可 以 用 这 些 表 达 式 来 定义 这 些 函 数 。 但 是 ， 对 应 于 MAJ、 
ODD 这 样 的 函数 ， 我 们 应 该 怎么 做 ? 肯定 还 会 有 其 他 布尔 函数 难以 写 出 其 布尔 表达 式 。 

积 之 和 表示 。 布尔 代数 的 基本 结论 之 一 是 ， 每 一 个 布尔 函数 都 可 以 使 用 操作 符 AND、 
OR 和 NOT (对 应 的 表示 符号 是 +、 联 结 和 ') 表示 出 来 ， 成 为 一 个 布尔 表达 式 。 这 个 结论 
听 上 去 或 许 会 令 人 惊讶 ， 稍 后 你 会 更 加 惊讶 地 实现 ， 实 现 它们 其 实 很 简单 。 例 如 下 面 的 真 


值 表 : 


mI ee SO © Sx 
BV © Ki © le 
RORopopoOIN 


MAJ(x, y, z) 的 积 之 和 表示 的 真 值 表 证 明 


Seooopph pIxX 


SopmpoOopr pI< 


2 
1 
0 
也 
0 
1 
0 
1 


0 


x 


只: 
0 
0 
0 
2 
0 
0 
0 


0 


Z XY XYZ， 
0 0 
0 0 
0 0 
0 0 
0 0 
下 0 
0 2 
0 0 


XYZ KYLFNZHXYZ +XYZ 


0 


RO SO SoDS 





Rnbhm oO pODS 


从 表 中 加 粗 显示 的 两 列 可 以 看 出 ， 对 于 每 一 种 变量 取 值 的 情况 它们 的 值 都 是 相等 的 ， 所 


以 我 们 证 明了 以 下 等 式 : 


MAJ(x, y, 2) = xXx'yz + xy'z + xyz' + xyz 


我 们 构造 的 布尔 表达 式 称 为 此 布尔 函数 的 积 之 和 表达 式 或 析 取 范式 。 
以 下 过 程 描述 如 何 从 真 值 表 中 得 到 布尔 函数 的 布尔 表达 式 : 对 于 真 值 表 中 函数 值 为 1 的 
[B96| 每 一 行 ， 先 找到 一 个 变量 的 布尔 乘积 表达 式 ， 使 得 该 表达 式 仅 在 这 一 行 取 值 为 1， 其 他 行 均 
为 0 ; 在 得 到 每 一 行 对 应 的 小 项 之 后 ， 通 过 取 不 同 小 项 的 布尔 和 ， 就 能 构造 出 布尔 表达 式 ， 
使 其 输出 值 与 布尔 函数 一 致 。 每 一 个 小 项 的 表达 式 都 是 输入 变量 (假若 这 个 变量 取 值 对 应 
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的 那 一 ee 的 那 一 行 是 0) 的 乘积 。 例 如 ， 表 达 式 xyz' 对 应 
“1 10” 行 ， 因 为 当 且 仅 当 x: y、z 的 值 分 别 为 1、1、0 的 时 候 ， 表 达 式 的 值 为 1。 你 很 容 
Se 

此 方法 适用 于 任何 布尔 函数 。 表 达 式 中 布尔 积 项 的 数量 取决 于 函数 值 真 值 表 中 有 多 少 项 
为 1。 又 如 奇偶 校 验 函 数 的 真 值 表 : 





x~“y .ODD XE OYE XPD KYD IN YL KY YY 
OO 0> i re 0 0 0 0 0 
7 了 IO 也 0 0 0 I 
中 汪 “Y 0 0 pe 
Bl 0 和 0 0 0 0 
六 有 人， 各 人 0 0 汉 0 2 
A od tO Ql G sad 0 0 0 0 
时 0 以 001 0 0 0 0 0 
| 大 TD 1 0 0 这 


ODD(x, y, z) 的 积 之 和 表示 的 真 值 表 证 明 


当 我 们 在 设计 计算 任务 的 电路 时 ， 还 会 遇 到 这 个 问题 ， 以 及 许多 类 似 的 问题 。 在 本 节 的 
最 后 ， od ocd eis i 





布尔 地 辑 为 数字 电路 有 设计 莫 定 了 六 入 ; 这 将 在 本 章 的 后 续 部 分 深 有 体会 。 特 别 是 当 我 
们 通过 构建 数字 电路 来 计算 布尔 函数 时 ， 积 之 和 形式 具有 重大 的 意义 。 具 体 来 说 ， 使 用 这 种 
表达 形式 将 为 任 一 布尔 函数 构建 数字 电路 的 问题 简化 为 构建 实现 AND、OR 和 NOR 的 电路 
组 成 问题 。7.2 节 中 将 介绍 一 些 基 础 知识 ,我 们 将 在 7.3 节 再 次 深入 探讨 这 一 主题 。 


练习 


7.1.1 本 节 中 讲 到 两 个 变量 的 布尔 函数 的 布尔 表达 式 表示 时 ， 使 用 的 表格 中 有 若干 列 没 有 给 出 标签 ， 
请 补充 完整 (例如 表达 式 xy' 是 AND 和 NOT 函数 表示 的 标签 ) 。 

7.1.2 在 德 . 摩根 定律 中 ， 如 果 “ 或 ” 改 为 “ 异 或 "， 还 成 立 吗 ? 试 证 明 或 举 出 反例 。 

7.1.3 ”请 用 真 值 表 证 明 x+yz= (x+y)(x +2z)。 

7.1.4 ”请 用 真 值 表 证 明 ((m 多 Kk) 人 @k)=m 。 


7.1.5 从 x 多 y= 区 y'+xy 的 定义 和 布尔 代数 的 基本 定理 出 发 ， 证 明 恒 等 律 、 归 零 律 和 结合 律 。( 参 考 
前 文 。) 


7.1.6 ”使 用 正文 中 给 出 的 密 钥 ,使 用 正文 使 用 的 方法 ， 给 出 消息 A N S W E R 被 编码 时 产生 的 密 文 。 
通过 使 用 相同 的 密 钥 和 相同 的 方法 解密 密 文 来 检查 答案 。 
7.1.7。 证 明 MAJ(x,y,2)=xXy+xz+yzo 
7.1.8 使 用 真 值 表 证 明 : 
MAJ(x,y, 2)= (x+ty+2z)(x +y+2)(x+ty +2z)(x+y+2") 
7.1.9， 以 上 一 题 的 表达 式 为 例 , 证明 布 尔 函 数 可 以 表示 为 若干 布尔 和 表达 式 的 布尔 积 。 这 种 表现 形式 
被 称 为 和 之 积 表达 式 。 


582 锣 7 得 
7.1.10 给 出 一 个 与 MAJ(w, x,y,z) 等 价 的 布尔 表达 式 。 
7.1.11“ 对 于 一 个 三 参数 布尔 函数 ， 仅 当 xy = 1 时 ， 函 数值 为 1， 其 余 情 况 为 0。 写 出 其 积 之 和 表示 。 
7.1.12 ”对 于 一 个 三 参数 的 2 选 1 复 合 函数 ， 即 如 果 z 为 0 则 函数 值 为 x, 如 果 z 为 1 则 函数 值 为 >»， 给 
出 其 积 之 和 表达 式 。 
7.1.13 为 (x +y)(x +z)Q+z) 函数 列 出 其 真 值 表 ， 并 写 出 一 个 等 价 的 简化 版 表达 式 。 
7.1.14 证 明 德 ， 摩根 规律 可 以 扩展 到 个 变量 ， 即 ,证明 对 于 任意 正 整 数 n， 以 下 两 个 等 式 均 成 立 。 
(TR2 B° Xn t= IT Pn 
(Ci 二 六 十 十 2 用 三 Xi02 "n 
创新 练习 
7.1.15 LFSR。 用 Java 编写 一 个 线性 反馈 移 位 寄存 器 (Linear Feedback Shift Register, LFSR)， 用 来 产 
生 随 机 的 序列 位 。 该 程序 模拟 下 图 所 示 的 12 位 寄存 器 的 操作 。 
111lololilololalololilal 
和 
寄存 器 计算 第 11 位 和 第 9 位 的 异 或 ， 将 结果 写 到 第 0 位 并 把 这 12 位 的 值 输出 ， 然 后 将 
所 有 位 向 左 移 一 位 。 在 程序 中 ,使 用 0 和 1 字符 来 表示 位 (类似 练习 7.1.18 的 方案 )， 并 使 用 
以 下 方法 : 用 一 个 由 “0” 和 “1” 组 成 的 字符 串 作 为 命令 行 参数 为 这 11 位 赋 初 值 。 然 后 第 
二 个 命令 行 参数 为 整数 x， 并 将 以 下 操作 重复 执行 n-11 次 来 创建 一 个 长 度 为 n 的 字符 : 将 第 
(i-11 ) 与 (i-9 ) 位 进行 异 或 得 到 第 i 个 字符 。 你 的 程序 运行 效果 应 该 如 下 所 示 : 
% java LFSR 11001001001 48 
110010010011110110111001011010111001100010111111 
答案 : 
public class LFSR 
public static void main(String[] args) 
String fill = args[0]; 
int n = Integer.parseInt(args[1]); 
for (int i = 11; i < ni i++) 
if (fill.charAt(i-11) == fi11.charAt(i-9)) 
fill 4= "0"; 
else fill += “1"; 
Stdout.println(Cfi11) ; 
} 
7.1.16 有 效 LFSR。 练 习 7.1.15 中 给 出 的 程序 在 n 变 得 很 大 的 时 候 将 不 再 适用 。 它 存在 两 个 问题 ， 
一 方面 它 运 行 需要 指数 级 时 间 ， 另 一 方面 在 2"-1 位 之 后 ， 序 列 将 开始 重复 。 我 们 将 11 和 
9 替换 为 63 和 62 来 解决 第 二 个 问题 ， 并且 通 过 只 保留 前 面 打 印 出 来 的 63 位 来 解决 第 一 个 
问题 。 
7.1.17 真 值 表 。 编 写 任何 给 定 的 布尔 函数 的 客户 程序 ， 打 印 出 该 函数 的 真 值 表 。 用 一 个 布尔 值 的 数 
组 作为 函数 唯一 的 参数 来 传递 所 需 的 所 有 输入 信息 。 提 示 : 请 参阅 SATsolver (程序 5.5.1 )。 
7.1.18 加密/ 解密 机 器 。 开 发 一 个 Java 程序 Crypto， 从 标准 输入 上 读 取 两 个 长 度 相等 的 字符 串 ， 且 


两 个 字符 串 都 是 由 0 和 1 字符 组 成 的 ， 将 这 些 字符 看 作 二 进 制 位 ， 并 将 这 两 个 输入 字符 串 “ 按 
位 异 或 " 。 也 就 是 说 ， 你 的 程序 运行 效果 应 该 如 下 : 


TIT9 


也 党 


药 建 计 丫 设备 583 


% java Crypto 

010100110100010101000011010100100100010101010100 
110010010011110110111001011010111001100010111111 
100110100111100011111010001110011101110111101011 


通用 的 基本 函数 集 。 假 设 有 一 组 基本 函数 集合 ， 通 过 集合 中 函数 的 组 合 可 以 实现 每 个 布尔 函 
数 ， 那 么 就 可 以 将 该 集合 用 硬件 实现 ， 从 而 得 出 任意 函数 的 电路 实现 。 我 们 将 这 个 集合 称 为 
通用 的 基本 函数 集 。 本 节 中 的 积 之 和 表明 了 {AND，OR，NOT} 就 是 这 样 的 通用 函数 (在 练习 
习 7.1.9 中 的 和 之 积 也 是 这 样 的 )。 已 知 NOT 只 有 一 个 参数 ， 所 有 其 他 函数 有 两 个 参数 ， 以 下 
函数 集 里 只 有 一 个 是 通用 的 ， 其 他 函数 集 不 是 ， 找 出 它 并 证 明 你 的 结论 。 

a. NoTand AND 

b. NOR 

c_ NAND 

d. AND and OR 


e. NoTand OR 
f. ANDand XOR 


基本 电路 模型 


要 了 解 计算 机 是 怎么 设计 的 ,我们 先 来 了 解 一 下 构造 电路 的 三 个 基本 元 素 : 

。 导线 

。 电 源 

。 控制 开关 

导线 负责 连接 电源 、 传 输 数 据 ， 并 连接 电路 元 件 ; 控制 开关 用 于 控制 电路 的 闭合 或 是 断 
开 。 一些 导线 被 指定 为 输入 ; 其 他 一 些 被 指定 为 输出 。 我 们 的 电路 抽象 定义 如 下 : 

电路 是 导线 、 电 源 和 控制 开关 组 成 的 互连网 络 ， 能 够 将 输入 线 上 的 值 转 换 为 输出 线 上 


的 值 。 


该 模型 足以 描述 任何 计算 设备 。 例 如 ,我们 可 以 使 用 它 来 描述 第 6 章 的 TOY 计算 机 的 
构造 : TOY 机 的 CPU 也 是 一 个 电路 ， 其 输入 端 连接 着 前 面板 上 的 机 械 开 关 以 及 按钮 ， 输 出 
端 连接 着 前 面板 上 的 指示 灯 。 我 们 的 目标 是 设计 一 个 电路 ， 它 能 够 根据 开关 设置 和 按钮 在 正 
确 的 时 候 点 亮 指示 灯 。 





计算 机 的 理想 模型 
模型 中 各 个 元 素 都 有 不 同 的 物理 状态 ， 我 们 分 别 以 二 进 制 值 来 表示 。 这 些 状态 包括 指示 
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灯 和 开关 的 开 与 关 、 导 线 是 否 连 接 到 电源 等 。 状 态 的 变化 对 应 于 不 同 的 信息 ， 可 以 在 电路 中 
传递。 

为 了 展示 如 何 与 物理 世界 相连 接 ， 在 模型 中 我 们 采用 了 二 维 的 几何 表示 。 导 线 对 应 于 在 
平面 中 绘制 的 线段 ;控制 开关 对 应 以 特殊 方式 交叉 的 电线 ; 电路 就 是 绘制 在 矩形 框 内 的 若干 
导线 。 我 们 用 一 个 矩形 框 来 表示 电路 的 边界 ， 其 中 输入 端的 导线 画 到 边界 即 终止 ， 输 出 端的 
导线 需要 超出 边界 。 当 我 们 对 电路 的 实现 细节 不 感 兴趣 时 ， 我 们 只 画 出 其 接口 ( 即 矩形 框 、 
输入 线 。 输 出 线 和 描述 标签 )， 如 下 图 所 示 。 

电路 其 实 是 一 种 抽象 的 表示 ， 不 局 限于 任何 一 种 简单 的 绘 、 接 0 
图 方法 。 我 们 使 用 这 种 规定 的 几何 表示 法 失去 了 一 些 灵活 性 ， 输入 _ 1 
但 是 这 个 方案 确实 提供 了 一 些 方便 。 这 样 我 们 得 到 的 最 直接 结 。“\ 一 0 
果 就 是 可 以 将 电路 绘制 成 一 个 由 内 部 连接 线路 构成 的 图 纸 ， 以 0 
此 来 表示 每 个 电路 的 具体 实现 。 如 今 电路 可 以 依据 图 纸 进行 制 
造 ， 所 以 设计 师 和 制造 商 之 间 对 电路 表示 的 一 致 性 就 显得 非常 
重要 。 

我 们 需要 精准 地 描述 关于 电路 怎样 组 合 在 一 起 的 细节 。 尽 管 从 抽象 的 角度 来 看 ， 这 些 细 
节 并 不 重要 ， 但 从 实践 的 角度 来 看 ， 我 们 需要 遵守 一 些 简单 的 规定 ， 以 确保 我 们 可 以 详细 地 
描述 电路 。 这 些 规 定 与 设计 现代 处 理 器 核心 集成 电路 所 要 遵循 的 “设计 规则 ”几乎 没有 什么 
差别 。 当 你 看 过 一 些 电 路 后 ， 你 不 妨 重读 这 段 以 确保 你 正确 理解 了 它 的 基本 定义 。 

导线 “电路 由 相互 连接 的 、 连 向 电源 以 及 连 向 控制 开关 的 导线 组 成 。 控 制 开关 是 两 条 导 
线 的 交叉 点 ， 其 中 一 条 导线 在 交叉 之 后 不 久 就 到 了 终点 。 我 
们 将 在 下 一 页 详细 讨论 控制 开关 的 操作 。 在 电路 图 中 ， 我 们 “电路 全 全 
将 导线 表示 为 线段 ， 通 常 是 水 平 的 或 坚 直 的 (也 有 时 候 是 对 [和 
角 线 )。 它 们 可 以 交叉 (彼此 跨越 ) 或 连接 (彼此 相连 )。 我 们 
假设 每 条 线 总 是 处 于 两 种 状态 之 一 ( 连 向 电源 或 连 向 地 )， 因 
此 我 们 可 以 使 用 二 进 制 值 表示 每 条 线 (1 或 0 )。 互 相连 接 的 » 
导线 必然 具有 相同 的 值 。 为 了 便于 查看 电路 中 的 导线 值 ， 我 衣 册 才 拓 证 洒 六 
们 用 粗 线 代表 值 为 1 的 导线 ， 用 细 线 代表 值 为 0 的 导线 。 

连接 电源 。 为 了 减少 图 纸 中 的 混乱 ， 我 们 假设 存在 一 个 始终 为 1 的 输入 ， 并 用 一 个 电源 
点 (power dot) 表示 电路 中 任意 位 置 的 一 个 到 该 输入 的 连接 。 在 实际 的 集成 电路 中 ,这 样 的 
点 也 可 能 表示 与 另外 一 层 上 电源 的 连接 。 除 非 连接 断 开 ， 和 否则 所 有 连接 到 电源 节点 的 导线 值 
为 1。 任 何 与 值 为 1 的 导线 相连 接 的 导线 值 也 为 T。 在 后 文中 ， 我 们 将 讲述 控制 开关 如 何 断 
开 连 接 ， 并 使 在 此 交汇 的 电线 的 值 翻转 至 0。 如 果 输 入 端口 的 值 为 0， 则 连接 到 它 的 导线 值 
也 为 0， 同样 ， 与 值 为 0 的 导线 连接 的 导线 值 为 0。 

给 入。 计算 机 上 的 输入 设备 用 于 向 电路 提供 一 组 离散 的 输 大 值 。 例 如 ， 当 你 按 下 键盘 
上 的 一 个 按键 ,那么 对 应 于 此 键 的 统一 编码 (Unicode) 值 将 被 输入 给 计算 机 的 CPU ; 如 果 你 
滑动 屏幕 或 触摸 板 ， 那 么 你 手指 的 相对 移动 量 对 应 的 二 进 制 数值 将 被 输入 给 计算 机 的 CPU ; 
TOY 的 开关 状态 变化 直接 对 应 于 二 进 制 的 输入 ; 等 等 。 输 入 值 的 变化 将 会 导致 导线 和 电路 
内 部 开关 状态 的 变化 ， 并 最 终 改变 输出 值 。 为 简单 起 见 ， 我 们 假设 电路 内 的 状态 变化 要 比 外 
部 变化 得 快 一 一 因此 ， 当 你 按 下 计算 机 键盘 上 的 某 个 键 或 扭 动 TOY 的 开关 时 ， 计 算 机 可 以 
立即 响应 。 







控制 开关 


“ 玉 连 向 电源 
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给 出 。 输 出 线 的 值 可 以 被 电路 外 部 的 器 件 或 仪器 所 感知 。 例 如 ， 如 果 计算 机 输出 一 系列 
字符 值 的 统一 编码 (Unicode)， 它 可 能 会 使 得 这 些 字符 被 连接 的 打印 机 打印 出 来 ， 如 果 计算 
机 输出 一 组 坐标 和 颜色 值 ， 它 会 使 得 显示 屏 菜 个 位 置 上 出 现 某 种 颜色 的 点 ，TOY 机 的 指示 
灯 直 接 对 应 二 进 制 输出 ; 等 等 。 通 常 ， 电 路 的 输出 还 可 以 作为 其 他 电路 的 输入 。 

规定 。 为 了 简单 起 见 ， 我 们 的 模型 通过 判断 导线 是 输入 端 或 输出 端 来 判断 信息 是 输入 到 
电路 还 是 从 电路 输出 。 在 几何 表示 中 ， 输 入 端 和 输出 端 都 位 于 电路 的 边界 处 ， 从 这 里 它们 连 
接 到 外 部 设备 ， 由 外 部 设备 来 响应 电路 的 开 7/ 关 状态 值 。 这 个 规定 非常 容易 理解 。 在 我 们 的 
图 纸 中 ， 连 接 到 电路 边界 的 导线 是 输入 ; 延伸 穿 过 电路 边界 的 导线 是 输出 。 输 入 线 表示 了 电 
路 外 部 产生 的 一 组 二 进 制 值 ， 在 流入 电路 后 进行 处 理 ; 输出 线 是 经 过 电路 计算 的 一 组 二 进 抽 
值 ， 并 可 以 用 于 在 电路 外 部 进行 存储 或 显示 等 一 系列 后 续 处 理 。 一 般 来 说 ,我 们 的 惯例 是 将 
输入 端 放 在 电路 的 顶部 或 左 侧 边界 ， 而 输出 端 则 是 置 于 底部 或 右边 界 。 这 个 惯例 是 为 了 方便 
理解 电线 的 用 途 。 在 二 些 情形 中 ， 输 入 端 导线 和 其 他 导线 或 许 会 沿 着 水 平 或 坚 直 方向 直接 穿 
过 电路 ,不 与 其 他 导线 连接 。 

控制 开关 ”理解 电路 的 关键 在 于 理解 控制 开关 的 操作 ， 即 电路 中 开关 控制 线 ( switch 
control line) 穿 过 另 一 条 导线 然后 结束 的 位 置 。 开 关 控 制 线 值 的 变化 可 能 会 断 开 与 其 交叉 的 
电线 与 电源 的 连接 ， 从 而 改变 该 导线 的 值 ， 过 程 如 下 所 述 。 PE 

打开 /关闭 开关 。 在 大 多 数 情况 下 ， 开 关 一 端的 导线 直接 与 值 为 1 的。 ， 办 由 打开 
电源 相连 。 如 果 这 个 开关 控制 线 的 值 为 0， 那么 这 个 开关 对 导线 的 状态 不 。 @ 1 
会 有 影响 。 相 反 ， 如 果 控制 线 的 值 为 1， 那么 开关 将 会 切断 连接 ， 使 得 导 
线 另 一 端的 值 变 为 0。 导 线 的 另 一 端 就 是 开关 的 输出 。 如 果 开关 控制 线 的 控制 开关 打开 
值 是 0， 那 么 输出 端的 值 是 1 ， 如 果 开关 控制 线 的 值 是 1， 那 么 输出 端的 。 。。 1 输出 关闭 
值 是 0。 eo}—° 

输入 /关闭 开关 。 更 一 般 来 说 ,我 们 认为 控制 开关 具有 输入 值 (不 一 ”打开 /关闭 开关 
定 是 1)。 输 入 线 和 输出 线 连接 成 直线 ， 开 关 处 于 中 间 位 置 的 交 义 点 上 。 
逻辑 上 ， 开 关 的 操作 很 简单 ， 如 果 开 关 控 制 线 为 0， 则 答 
入 线 和 输出 线 相连 接 ， 因 此 它们 具有 相同 的 值 ( 均 为 0 或 
答 入 /0 一-。 psi 的 人 。 均 为 1); 如 果 开关 控制 线 为 1， 则 输入 线 和 输出 线 不 连接 ， 
J -和 “4 因此 输出 端 电线 的 值 为 0( 与 输入 端的 值 无 关 )。 

也 就 是 说 ， 我 们 认为 控制 开关 是 可 以 用 于 切断 从 输入 
端 到 输出 端 之 间 的 连接 控制 方式 (通过 打开 开关 控制 线 )。 
的 由 了 mustynr 。 如 我 们 将 看 到 的 那样 ， 控 制 连 接 的 这 种 简单 的 功能 可 以 作 
A 为 复杂 电路 的 基础 ， 并 且 是 构建 计算 机 电路 和 其 他 电子 元 
Pe 件 电路 的 关键 。 
布局 规定 。 控 制 开关 的 输入 是 电路 的 一 个 输入 或 另 一 

个 开关 的 输出 。 控 制 开关 的 输出 可 能 用 作 另 一 个 开关 的 控制 线 ， 也 可 能 是 另 一 个 开关 的 输入 
端 ， 抑 或 是 一 个 电路 输出 。 绘 制 控制 开关 时 ， 我 们 并 没有 明确 区 分 输入 和 输出 。 在 我 们 的 电 
路 中 这 种 区 别 是 清楚 的 ， 因 为 输入 线 总 是 连接 到 电源 或 另 一 个 开关 的 输出 线 ， 并 且 因为 输入 
通常 位 于 我 们 电路 的 左 侧 或 顶部 ， 而 输出 位 于 右 侧 或 者 底部 。 

一 个 实例 。 如 何 构建 一 个 控制 开关 ? 为 了 更 加 直观 ， 我 们 分 析 继电器 relay) 设备 。 在 
继电器 中 ， 控 制 线 连 接 到 一 块 电磁 铁 ， 电 磁铁 通电 时 可 以 吸引 一 小 段 导 线 ， 这 段 导 线 能 够 将 


开关 控制 关闭 


开关 控制 打开 ， 
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输入 线 连接 到 输出 线 ; 同时 这 段 导 线 也 连接 到 弹 往 ”如 果 磁 铁 断 开 ， 弹 簧 将 拉动 导线 使 得 输 
人 端 连接 到 输出 端 ; 如 果 磁 铁 接 通 ， 它 施加 比 弹簧 更 强 的 力 来 拉动 导线 ， 以 便 断 开 输入 和 输 
出 之 间 的 连接 。 这 种 继电器 仍然 运用 于 各 种 物理 设备 中 ， 如 烤 面 包机 、 收 音 机 、 蜂 鸣 器 、 门 
铃 等 。 

我 们 不 用 继电器 来 建造 现代 计算 机 是 因为 它们 的 体积 大 、 和 运行 慢 、 成 本 高 ， 并 且 连 接 几 
百 万 至 几 士 亿 的 继电器 是 很 低 效 的 。 现 在 大 多 数 计算 机 中 的 开关 是 通过 一 种 被 称 为 晶体 管 的 
微小 器 件 实现 的 。 一 些 唱 体 管 非常 小 ， 甚 至 比 我 们 绘制 图 纸 中 的 电线 还 要 小 。 早 期 的 计算 机 
是 由 其 他 类 型 的 开关 制 成 的 :包括 真空 管 、 继 电器 和 其 他 种 类 的 设备 等 ; 几乎 从 计算 机 发 明 
以 来 ,构建 效率 高 、 体 积 小 、 成 本 低 的 计算 机 在 很 大 程度 上 取决 于 构建 更 快 、 更 小 、 更 高 效 
的 开关 。 


概要 图 控制 关闭 、 控制 开局 








磁铁 关闭 一 磁铁 开启 二 





oi eh NE i 
继电器 的 分 析 (控制 开关 ) 
电路 “在 构建 电路 的 过 程 中 ， 我 们 可 能 将 电路 输入 连接 到 开关 控制 线 ， 也 可 能 将 开关 
答 出 连接 到 其 他 开关 控制 线 或 电路 输出 。 开 关 控制 线 值 的 变化 通过 我 们 的 电路 传输 并 构成 计 
算 。 由 于 这 些 变化 可 能 很 复杂 ， 我 们 将 详细 地 讲解 每 个 连接 。 
开关 电路 分 析 。 理 解 电路 的 关键 在 于 理解 控制 开关 的 操作 ， 以 及 开关 所 在 的 位 置 对 导线 
的 影响 。 当 开关 控制 线 的 值 改变 时 ， 可 能 导致 开关 输出 的 值 的 变化 。 如 前 所 述 。 


举 个 例子 ， 右 图 所 绘制 的 电路 中 有 三 个 开关 ， 分 别 标 有 Hj 

A、B 和 C。 这 个 电路 实现 了 基本 构建 要 素 之 一 一 一 “或 门 ”， ,并 

它 的 输出 值 是 将 两 个 输入 值 进行 带 辑 或 〈or) 运算 ， 稍 后 我 们 一 输出 

会 详细 描述 。 要 理解 这 种 行为 ， 我 们 可 以 分 析 对 于 所 有 可 能 A se 

值 的 输入 情况 下 开关 的 响应 ， 如 图 所 示 。 当 输入 控制 一 个 开 和 jy 

关 时 ,我 们 可 以 知道 该 开关 的 输出 。 如 果 该 输出 线 控制 着 一 US 

个 开关 ， 那 么 我 们 可 以 知道 该 开关 的 输出 ， 等 等 。 “Oy 
我 们 首先 来 分 析 两 个 输入 都 为 0 的 情况 。 在 这 种 情况 下， 输入 均 为 1 或 其 中 一 个 输入 为 1 

A 和 B 都 将 输入 连接 到 输出 ， 因 此 开关 C 的 输入 为 1。 然 后 一 一， 

开关 C 从 其 电源 点 断 开 连接 ， 因 此 输出 是 0。 在 其 他 情况 下 ， 

开关 A 或 开关 B 断 开 与 左 侧 电 源 点 的 连接 ， 开 关 C 的 输入 为 和 

0， 因 此 不 会 断 开 与 其 电源 点 的 连接 ， 输 出 为 1。 这 种 分 析 确 $0 

实 有 点 复杂 ; 幸运 的 是 ， 我 们 只 需要 对 为 数 不 多 的 这 种 规模 

的 小 型 电路 做 分 析 就 可 以 了 。 员 由 六 : 


组 合 电路 。 虽 然 定 义 里 并 没有 明显 的 体现 ， 但 不 同类 ”一 个 开关 电路 (或 门 ) 示意 图 
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型 的 电路 之 间 存 在 着 一 个 根本 区 别 ， 即 电路 中 是 否 存 在 环 路 (loop)。 通 常 ， 如 果 电 路 
中 没有 环 路 ， 就 像 我 们 前 面 分 析 过 的 电路 类 型 ， 其 最 终 的 输出 值 总 是 唯一 的 。 组 合 电路 
(combinational circuit) 是 指 没 有 环 路 的 电路 ， 因 此 ， 其 输出 值 仅 取 决 于 输入 值 ， 与 电路 的 当 
前 状态 无 关 。 在 组 合 电路 中 ， 一 个 很 经 典 的 例子 就 是 加 法 器 (adder)。 它 采用 2n 个 输入 值 表 
示 两 个 天 位 的 二 进 制 值 , + 1 位 的 输出 用 于 表示 计算 的 和 。 无论 以 何 种 顺序 输入 ,我 们 期 
望 经 过 短暂 的 延 时 后 一 旦 输出 值 稳定 ,我 们 可 以 看 到 从 电路 总 是 输出 相同 的 求 和 结果 。 我 们 
将 在 7.3 节 中 讲述 一 个 完整 的 加 法 器 电路 的 设计 。 

时 序 电路 。 相 比 之 下 ， 时 序 电 路 ( sequential circuit) 具有 环 路 。 时 序 电路 具有 这 样 的 性 
质 : 输出 值 取 决 于 随时 间 变 化 的 输入 序列 。 计 数 器 ( counter) 是 时 序 电 路 的 一 个 经 典 例子 ， 
它 可 以 有 一 个 输入 值 和 个 输出 值 。n 个 输出 是 输入 从 0 变 为 1 并 再 变 回 0 的 次 数 的 二 进 制 
表示 。 有 时 序 电路 的 独特 之 处 在 于 其 内 部 元 件 的 状态 不 仅 取决 于 输入 的 当前 状态 ， 而 且 取 决 于 
过 去 的 状态 。 

在 你 了 解 一 些 组 合 电路 或 时 序 电 路 之 后 ， 你 将 会 更 好 地 理解 这 种 区 别 。 组 合 电 路 是 两 种 
类 型 电路 中 较为 简单 的 一 种 ， 因 此 我 们 将 先 在 7.3 节 中 详细 介绍 组 合 电 路 。 之 后 在 7.4 节 中 
对 时 序 电路 进行 讲解 。 

正如 你 所 看 到 的 ， 本 节 在 开始 介绍 了 构建 电路 中 所 用 到 的 基础 部 件 ， 我 们 使 用 这 些 电路 
来 构建 几 个 更 大 的 模块 ,然后 将 这 些 模块 的 接口 组 合 在 一 起 完成 一 个 处 理 器 。 很 容易 看 出 ， 
我 们 从 开关 到 处 理 器 只 需要 两 个 层次 的 抽象 。 

逻辑 设计 和 现实 世界 ”我 们 的 模型 侧重 于 处 理 器 的 逻辑 设计 (logical design)， 而 不 是 物 
理 实现 。 该 模型 并 没有 考虑 机 器 重量 多 大 、 由 何 种 材料 组 成 、 需 要 多 少 电 能 、 什 么 颜色 ， 以 
及 其 他 物理 特性 。 它 甚至 不 要 求 电 路 的 电气 特性 。 例 如 ， 电 路 中 控制 开关 的 设计 并 不 比 运输 
水 和 煤气 的 管道 更 难 。 我 们 假设 构建 的 是 理想 设备 ， 并 没有 考虑 晶体 管 等 新 技术 。 

构建 计算 机 的 过 程 中 使 用 了 各 种 开关 ， 这 证 明了 控制 开关 这 一 抽象 设计 的 有 效 性 。 事 实 
上 ， 计 算 性 能 的 提高 也 建立 在 更 高 效 的 开关 的 基础 上 。 

在 现实 世界 中 ， 开 关 和 导线 类 型 的 差异 要 仔细 考虑 ， 所 以 我 们 的 抽象 只 是 一 个 起 点 。 有 
很 多 因素 并 没有 充分 考虑 ， 如 驱动 开关 所 需 的 功率 、 开 关切 换 连接 所 需 的 时 间或 开关 的 物理 
尺寸 等 。 当 我 们 真正 想 要 制造 计算 机 时 就 ， 需 要 面 对 所 有 这 些 考虑 因素 以 及 其 他 因素 了 。 

在 现实 中 ， 我 们 同样 需要 考虑 放置 每 个 导线 和 开关 的 位 置 ， 为 了 解决 这 个 问题 ， 首 先 指 
定 每 个 电路 的 布局 。 你 可 能 会 想到 ， 我 们 开发 的 每 个 电路 都 将 对 应 于 具有 伸 出 边缘 的 导线 的 
物理 设备 ， 为 了 将 它们 连接 在 一 起 ， 我 们 需要 决定 输入 和 输出 电线 的 物理 位 置 。 在 现代 电路 
设计 中 ， 移 动 电路 中 的 模块 会 相对 灵活 方便 些 ， 但 每 个 模块 最 终 都 会 占据 一 定 的 空间 。 虽然 
我 们 没有 完全 考虑 所 有 的 细节 ， 如 导线 宽度 、 导 线 之 间 的 距离 或 连 线 交叉 等 细节 ， 但 我 们 的 
方法 可 以 很 容易 地 扩展 以 支持 它们 。 

导线 、 电 源 点 、 控 制 开 关 和 电路 等 概念 尽管 简单 但 非常 有 用 。 它 们 足够 用 来 设计 任意 复 
杂 的 机 器 。 它 们 代表 了 物理 世界 与 抽象 的 计算 世界 之 间 的 狭窄 接口 ， 这 个 抽象 世界 为 我 们 在 
技术 上 改进 这 些 机 器 提供 了 无 尽 的 潜力 和 可 能 。 


问答 环节 


问 : 开关 这 个 词 是 指 某 个 抽象 的 东西 ， 它 可 以 开 或 关 ， 还 是 指 类 似 于 开 灯 按钮 的 真实 
东西 ? 
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答 : 都 是 。 开 关 和 导线 是 我 们 用 于 设计 电路 的 基本 抽象 构建 块 ， 也 是 计算 机 的 物理 基 
础 。 以 计算 机 科学 家 的 观点 ， 开 关 的 制造 方式 是 无 关 紧 要 的 。 电 路 研究 即 研究 开关 网 络 的 集 
合 。 我 们 已 经 涉及 两 种 不 同形 式 的 开关 的 物理 实现 : TOY 计算 机 前 面板 上 的 开关 和 在 我 们 
的 电路 中 以 交叉 线形 式 实现 的 控制 开关 。 从 科学 家 或 工程 师 的 角度 来 看 ， 开 关 至 关 重 要 ， 因 
为 在 现实 世界 中 找到 新 的 开关 材料 或 构建 新 开关 可 能 会 带 来 新 的 见解 或 产生 新 的 讨论 。 开 关 
与 现 有 计算 机 的 已 知 知识 直接 相关 。 开 关 可 能 是 继电器 或 晶体 管 ， 或 物理 世界 的 某 些 东西 ， 
如 遗传 物质 、 神 经 元 、 分 子 或 黑洞 等 。 

问 : 电路 怎么 理解 ”这 个 词 似乎 是 指 某 种 循环 ,但 我 们 主要 是 指 连接 在 一 起 的 事物 。 

答 : 与 导线 类 似 ， 这 个 术语 来 自 于 电子 电路 ， 当 接 通 电源 时 就 有 了 循环 。 一 个 灯泡 点 
亮 ， 它 必须 在 这 样 一 个 循环 ; 这 就 是 为 什么 用 来 连接 电源 时 需要 有 两 个 插头 。 我 们 的 模型 并 
没有 解决 电路 如 何 工作 的 问题 ， 你 不 需要 对 电气 有 过 多 的 了 解 就 能 理解 我 们 的 模型 。 电 路 在 
计算 机 发 展 中 的 作用 是 不 可 否认 的 ， 对 电气 的 理解 自然 对 计算 机 的 学 习 也 是 有 帮助 的 。 最 
基本 的 要 求 是 你 可 以 理解 我 们 的 简单 抽象 规则 ， 并 且 对 于 一 组 给 定 的 输入 行 值 (物理 开关 设 
置 )， 能够 确定 哪个 输出 线 连 接 到 电源 点 ， 从 而 使 得 相应 的 灯 点 亮 。 


练习 
7.2.1 下 列 电路 在 什么 条 件 下 输出 为 0? 


输入 
4 


答案 : 当 且 仅 当 所 有 的 输入 都 是 0。 
7.2.2 说 明 练 习 7.1.1 在 什么 条 件 下 输出 是 1。 
7.2.3 下 列 电路 在 什么 条 件 下 输出 为 1? 


7.2.4 ”说 明 练 习 7.1.3 中 输出 为 0 的 条 件 。 
7.2.5 将 值 为 1 的 电线 加 粗 ， 并 给 出 以 下 电路 的 输出 。 


1 0 
答案 : 1 
1 


注意 : 在 我 们 的 电路 中 ， 当 输出 端 电线 值 为 1 时 ， 其 始终 连接 到 一 个 电源 点 。 
7.2.6 “将 值 为 1 的 电线 加 粗 ， 并 给 出 以 下 电路 的 输出 。 
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je, 
7.3 组 合 电路 

许多 计算 任务 都 可 以 归 约 为 寻找 特定 数学 函数 在 给 定 输入 情况 下 的 函数 值 。 在 本 节 中 ， 
我 们 重点 关注 构建 电路 以 完成 这 部 分 任务 。 例 如 ， 我 们 知道 任何 计算 机 都 需要 一 个 将 两 个 二 
进 制 数 相 加 的 电路 : 那么 我 们 如 何 构建 一 个 这 样 的 电路 呢 ? 

解决 这 个 问题 的 过 程 中 你 可 能 会 有 两 个 惊喜 的 发 现 。 第 一 ， 有 一 个 简单 的 系统 化 的 方法 
来 构建 电路 ， 它 可 以 计算 任何 定义 明确 的 布尔 函数 。 我 们 会 在 本 节 中 的 后 续 部 分 介绍 这 种 方 
法 。 一 旦 你 掌握 了 这 种 方法 ,你 就 会 发 现 它 仅 在 输入 值 较 少时 适用 ， 因 为 过 多 的 输入 值 会 导 
致 大 量 的 开关 和 导线 的 使 用 。 在 设计 计算 机 的 过 程 中 ,我们 不 仅 要 考虑 如 何 为 我 们 需要 的 函 
数 建立 电路 ， 而 且 还 要 考虑 这 样 的 电路 在 现实 世界 是 否 可 行 。 第 二 ， 对 于 实现 TOY 这 样 的 
计算 机 需要 的 函数 所 需 的 电路 ， 只 需要 经 过 一 些 简单 的 层次 抽象 就 能 开发 出 来 ， 而 且 非 常 容 
易 理解 。 本 节 的 重点 是 学 习 这 类 电路 的 原理 。 

我 们 会 具体 讲解 如 何 为 布尔 函数 构建 对 应 的 电路 。 这 些 电 路 被 称 为 组 合 电路 
( combinational circuit)， 因 为 它们 的 输出 值 取决 于 它们 的 输入 值 。 组 合 电路 是 理解 计算 机 操 
作 必 不 可 少 的 出 发 点 。 

我 们 从 大 家 所 知 的 门 级 电路 开始 讲解 。 它 们 的 基本 功能 是 实现 “ 非 ” ”或 非 ” “或 ”以 及 
“与 ”等 布尔 函数 。 然 后 ,我 们 将 进入 更 深 的 一 个 层次 : 通过 将 众多 门 级 电路 连接 在 一 起 ， 
构建 实现 各 种 逻辑 开关 的 电路 。 之 后 ， 我 们 考虑 将 布尔 函数 的 真 值 表 定义 转换 为 实现 它 的 电 
路 的 一 般 结 构 。 为 了 解释 这 些 模 块 的 构建 过 程 ， 我 们 首先 从 将 两 个 二 进 制 数字 相 加 的 电路 开 
始 。 通 过 本 节 内 容 , 我 们 会 对 电路 组 合 、 电 路 连接 ， 以 及 利用 它们 在 更 深层 次 上 构建 电路 等 
有 更 深入 的 了 解 。 

门 ” 正 如 我 们 在 7.1 节 看 到 的 那样 ,布尔 逻辑 是 一 个 抽象 的 数学 系统 ， 在 近 两 个 世纪 
里 ， 它 在 数学 推理 中 发 挥 了 核心 作用 。 但 是 它 与 构建 计算 机 有 什么 关系 呢 ? 这 种 联系 是 由 克 
劳 德 .香农 (Claude Shannon) 在 20 世纪 .30 年 代 在 麻 省 理工 学 院 求学 时 建立 的 ， 这 是 一 项 
深远 的 举措 。 香农 认为 ， 我 们 可 以 构建 实现 布尔 功能 所 对 应 的 
数字 电路 ( digital circuit)， 因 此 可 以 将 布尔 逻辑 直接 映射 成 对 应 
的 计算 设备 。 当 时 一 部 分 人 (包括 香农 的 导师 ) 正在 尝试 使 用 模 
拟 电路 (analog circuit) 构建 计算 机 ， 这 种 电路 用 导线 上 的 电压 
来 表示 实数 ， 也 有 一 部 分 人 在 没有 布尔 逻辑 提供 的 严密 基础 上 
试图 研究 数字 电路 。 

下 面 我 们 跟随 香农 用 电线 和 开关 来 构建 称 为 门 的 小 型 设 
备 ， 从 而 将 电路 模型 提高 到 一 个 更 高 的 抽象 层 (自从 他 的 作品 
出 版 以 来 ， 每 个 人 都 已 经 做 过 了 )。 具体 来 说 ， 我 们 会 构建 实现 
“与 ”“ 或 ”“ 或 非 ” 和 “ 非 ”的 布尔 函数 的 门 电路 ， 包 括 多 种 输 “已 获 诺基亚 公司 授权 。 

入 的 情况 。 正 如 我 们 将 要 看 到 的 ， 门 是 非常 简单 的 ， 用 几 个 开 ” 克 劳 德 * 香农 (1916 一 2001) 
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关 就 可 以 构建 ， 并 且 它 的 功能 也 足够 强大 ， 可 以 用 来 构建 任何 计算 设备 。 

同 所 有 的 电路 一 样 ， 我 们 用 一 个 方 框 表示 门 电路 ， 其 中 包含 输入 线 (连接 到 方 框 的 边 
缘 )、 输 出 线 ( 穿 过 方 框 的 边缘 ) 和 开关 ， 以 及 将 它们 连接 在 一 起 的 导线 。 门 电路 的 连接 
都 非常 简单 ， 其 中 输入 由 开关 控制 ， 其 他 连接 很 简单 ， 如 果 输 入 不 改变 值 ， 输 出 也 不 会 改 
变 。 但 是 ， 当 输入 发 生变 化 时 ， 输 出 会 在 很 短 的 时 间 后 发 生变 化 ， 这 段 时 间 称 为 切换 时 间 
(switching time )。 换 名 话说 ， 门 级 电路 是 一 个 简单 的 电路 ， 每 当 输入 线 上 的 值 发 生变 化 ， 经 
过 一 定 的 时 间 间 隔 后 ， 它 的 输出 线 上 的 值 是 输入 线 值 的 基本 布尔 函数 值 。 

非 门 。 你 可 能 已 经 注意 到 ， 如 果 我 们 将 开关 的 控制 端 视 为 输入 ， 则 我 们 的 “打开 /关闭 ” 
开关 就 是 一 个 实现 布尔 “ 非 ”功能 的 门 。 将 开关 控制 端 看 作 一 个 输入 的 话 ， 如 果 输 入 为 0， 
输出 为 1 ; 如果 输 入 为 1， 则 输出 为 0。 因 此 ， 如 果 输 入 值 是 x， 则 输出 值 是 x'。 因 此 从 现在 
开始 ， 我 们 将 把 “打开 /关闭 ”开关 称 为 非 门 。 在 下 面 图 中 的 左 侧 展示 了 非 门 的 实现 细节 。 

11013| 非 门 有 时 被 称 为 逆 变 器 (inverter)。 
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由 开关 构建 的 非 门 、 或 非 门 、 或 门 和 与 门 


或 非 门 。 如 上 图 中 第 二 列 所 示 ， 将 打开 /关闭 开关 的 输出 与 输入 /关闭 开关 的 输入 连接 
可 以 构建 一 个 门 ， 当 且 仅 当 两 个 输入 (开关 控制 线 ) 都 为 0 时 ， 门 的 输出 为 1。 当 且 仅 当 两 
个 输入 都 关闭 时 ， 输 出 线 才能 连接 到 1， 因 为 只 要 任 一 输入 是 1， 则 连接 将 被 中 断 。 检 查 真 
值 表 ， 我们 看 到 这 个 电路 实现 了 布尔 或 非 函 数 。 

或 门 5“ 或 ”的 运算 即 是 对 “或 非 ”的 布尔 值 进行 取 反 运算 ， 所 以 我 们 通过 将 一 个 “或 
非 门 ”的 输出 连接 到 一 个 “ 非 门 ”来 建立 一 个 “或 门 ” 。 当 且 仅 当 两 个 输入 都 是 0 时 ， 输 出 
才 是 0。 你 可 以 查看 图 中 第 三 列 的 开关 操作 的 细节 来 验证 真 值 表 ， 土 面 这 个 简单 的 分 析 会 让 
你 更 容易 理解 。 

与 门 。 德 “摩根 定律 为 我 们 提供 了 一 个 利用 “或 非 门 ”打造 “与 门 ”的 途径 。 我 们 对 两 
个 输入 的 结果 都 取 反 ， 即 如 果 x 和 y 是 输入 ,那么 有 (x'+y')'= xy。 当 且 仅 当 两 个 输入 都 
是 1 时 ,输出 为 1。 接 下 来 ,你 可 以 通过 检查 图 中 第 四 列 的 开关 操作 来 验证 这 一 事实 ,但 使 

用 布尔 代数 的 证 明 过 程 更 容易 理解 。 
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多 路 门 。 我 们 用 来 构建 或 非 门 、 或 门 和 与 门 的 方法 ， 可 以 很 自然 地 进行 扩展 ， 以 用 来 
处 理 任 意 多 路 输入 的 情况 。 为 了 建立 一 个 n 个 输入 的 或 非 门 ， 我们 把 个 开关 (一 个 “ 打 
开 / 关 闭 ” 开 关连 接 n-1 个 “输入 /关闭 ”开关 ) 连接 起 来 : 最 后 的 输出 值 是 所 有 输入 值 求 
“或 非 ” 值 。 和 双 路 输入 门 一 样 ， 我 们 通过 对 或 非 门 的 输出 进行 取 反 得 到 或 门 对 或 非 门 的 


输入 进行 取 反 得 到 与 门 。 如 下 所 示 : 


一 
王 < 
王 三 
一 x 
"< 


z 
1 

—— U+VIWHX+Y+Z 
OR 


Eg 
~ 
村 
x 
Wp < 
sm N 


(Ut+VIWHX+Y+Z) " 


当 且 仅 当 输入 为 


— UVWXYyZ 


当 且 仅 当 输 入 为 


111111 时 ， 输 击 为 ] 


后 000000 时 ， 输 出 为 1 


电路 
uvVvw x Y 2z 
U+VHWHX+Y+Z 
OR 
Ui We NX eR 
. LAHVAHWFX+Y+Z) " 
Se ( y+2) 
UM WEXA WZ 
UVWXYZ 


AND 


由 开关 构建 多 路 与 、 或 非 、 与 门 
请 注意 ， 按 照 扩 展 的 德 . 摩根 定律 (参见 练习 7.1.14 )， 可 以 有 两 种 方法 来 使 用 或 非 门 


的 输出 。 


几何 表示 法 ,旋转 ,翻转 和 双重 否定 。 在 这 一 小 节 中 ， 简 单 地 回顾 一 下 与 我 们 在 电路 设 
计 中 有 关 的 几何 图 形 使 用 的 惯例 。 一 方面 ， 我 们 总 是 希望 在 进行 电路 设计 时 ， 将 电路 一 层 一 
层 抽象 出 来 。 例 如 ， 当 我 们 使 用 门 电 路 构建 更 高 级 别 的 电路 组 件 时 ， 我 们 上 只 展示 门 电 路 的 接 


非 门 
i 
1 
唐 -到 
“7 垂直 多 路 或 问 
oR 


Xe 


X= Xr 入 
-oT 多 准 
2 
X 


双重 非 门 则 消除 非 
(双重 否定 为 肯定 ) 
总 x x A 


1 xj 所 
NOT 
| X7 于 
NOT 
I | 
x x Ls XOFXY 十 X HX Xs +Xs XtX, 


等 价 电 路 的 例子 ( 左 侧 : 接口 ; 右 侧 : 电路 ) 





口 而 非 电 路 实现 细节 。 男 一 方面 ， 我 们 想 让 
你 更 直接 地 感受 到 电路 设计 的 全 过 程 ， 因 此 
即使 在 高 度 抽 象 的 情况 下 ， 我 们 也 会 向 你 展 
示 底 层 电路 设计 。 这 种 设计 方法 产生 的 一 个 
结果 就 是 :几何 图 形 的 使 用 将 是 我 们 所 有 设 
计 中 一 个 重要 考虑 因素 ， 即 使 有 时 并 不 必 
要 。 例 如 ， 在 电路 中 表示 与 门 、 或 门 和 非 门 
时 ， 传 统 电路 设计 的 方法 是 使 用 大 小 相同 的 
不 同形 状 表示 不 同 的 门 ， 而 我 们 会 使 用 尺寸 
略微 不 同 的 矩形 。 

这 种 方法 的 一 个 结果 是 ,在 构建 更 复 
杂 的 电路 时 ， 有 时 需要 旋转 、 反 射 或 拉 伸 我 
们 的 门 电路 ， 有 时 会 使 得 这 些 电路 不 那么 容 
易 理 解 。 左 图 中 显示 了 一 些 例子 。 第 一 组 示 
例 显示 了 我 们 传统 使 用 的 非 门 的 四 种 实现 方 
式 : 输入 可 以 在 顶部 或 左边 ， 输 出 可 以 在 右 
边 或 底部 。 第 二 个 例子 显示 ， 将 一 个 非 门 的 
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输出 连接 到 另 一 个 非 门 的 输入 相当 于 什么 都 没 做 。 这 个 例子 强调 了 我 们 不 使 用 输入 和 输出 之 
间 的 物理 连接 ， 而 是 逻辑 连接 。 在 双 非 门 中 ， 输 出 线 的 值 等 于 输入 线 的 值 ， 但 它们 在 物理 上 
并 没有 直接 相连 接 。 最 下 面 的 例子 显示 了 一 个 多 路 或 门 ， 经 过 反射 和 旋转 ， 变 成 垂直 摆 放 的 
形状 。 这 种 类 型 的 门 在 我 们 的 电路 中 经 常 出 现 ， 用 以 收集 来 自 多 个 资源 的 值 。 

当然 ， 将 输入 /输出 从 顶部 / 右 侧 移动 到 左 侧 /底部 、 消 除 双 非 门 、 对 门 电路 进行 反射 
和 旋转 ， 对 于 给 定 输入 产生 的 输出 值 没 有 任何 影响 。 我 们 现在 展示 这 些 变 体 以 避免 在 更 大 的 
电路 中 看 到 它们 时 产生 疑惑 。 即 使 是 将 电路 进行 180° 旋转 或 者 上 下 颠倒 ， 都 不 会 影响 电路 
的 操作 。 我 们 总 是 希望 输入 放 在 左 侧 或 项 部 ， 输 出 在 右 侧 或 底部 ， 这 样 做 的 唯一 原因 是 让 你 
更 容易 看 懂 电 路 在 做 什么 。 
接口 


u 
1 


广义 多 路 门 。 扩 展 多 路 门 的 思想 ， 我 们 还 可 以 选择 

z 将 某 一 些 输入 取 反 ， 用 以 计算 如 uv'w'xy'z 函数 ， 从 而 

得 到 一 个 扩展 的 广义 与 门 ， 这 些 门 对 于 实现 组 合 电 路 以 

及 底层 电路 分 析 是 很 有 必要 的 ， 也 值得 研究 。 

门 的 实现 100101 时 输出 为 1 首先 ， 请 注意 前 文 的 多 路 “与 门 ”具有 一 个 重要 的 
| 可 属性 ， 即 只 有 一 组 输入 值 可 以 使 得 输出 为 1。 我 们 可 以 
dd 利用 这 个 属性 ， 将 其 中 一 些 输 入 取 反 ， 从 而 计算 若干 个 

本 人 小 项 组 成 的 “与 ”函数 。 
左边 最 上 方 的 图 展示 了 我 们 用 于 这 种 门 电路 的 接 

口 。 它 描绘 了 计算 函数 uy'w'xy'z 的 “广义 与 门 ”的 接 

口 。 规 则 很 简单 : 当 输 入 线 上 有 一 个 圆 时 ， 对 输入 取 


Vw xy 
OO 让 ie 

mm UV'W'XY'Z 
G-AND 


当 且 仅 当 输入 为 


UV 'W'xYy'z 


反 。 第 二 张 图 展示 了 如 何 使 


Ps 用 非 门 和 与 门 来 实现 这 样 的 “ ，， 
双重 否定 消除 的 电路 电路 。 而 在 第 三 张 图 显示 的 oo 
电路 中 ,任何 取 反 的 输入 都 加” 了/" 


时 才 竹 - me 


G-AND 
广义 与 门 (一 个 例子 ) 


会 对 应 于 一 个 双 非 门 ， 所 以 
所 有 这 些 非 门 可 以 被 删除 ， 


长 

当 且 仅 当 输入 为 

输入 的 所 有 值 100 时 ,输出 为 1 
0 0 0 


留 下 简化 后 的 电路 ， 如 最 下 

面 的 图 所 示 。 如 果 你 不 确定 这 个 电路 是 如 何 工 作 的 ， 可 以 参考 右 0 0 
侧 图 ,这 是 一 个 开关 状态 分 析 ， 展 示 了 对 于 三 个 输入 的 “广义 与 
门 ”的 所 有 可 能 组 合 ， 并 计算 了 函数 uy'w'。 ‘ 
这 些 门 电路 简洁 且 灵 活 ， 它 们 构成 了 我 们 将 在 本 节 稍 后 讲解 

的 电路 的 基础 。 如 果 你 还 不 能 理解 它们 是 如 何 工 作 的 ， 你 可 以 稍 
后 复习 一 遍 。 但 是 要 知道 的 是 ， 其 实 从 门 电 路 的 接口 处 就 能 很 容 1 
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易 地 看 出 来 它 的 功能 一 如 果 导 线 表示 1， 贺 圈 表 示 0, 那么 接口 ”学员 -， 

表示 的 二 进 制 数 就 是 使 得 输出 是 1 的 输入 值 。 :|| 
比 起 开关 ， 门 电路 为 我 们 提供 了 更 高 的 抽象 层次 。 它 给 我 们 和 

的 最 大 贡献 是 使 我 们 能 够 忽略 使 用 开关 工作 的 细节 ， 而 使 用 布尔 媒 册 _， 


逻辑 来 思考 电路 设计 问题 。 为 清楚 和 方便 起 见 ， 我 们 已 经 考虑 了 1 


非 门 、 或 非 门 、 与 门 和 或 门 的 明确 构造 ， 并 扩展 了 具有 多 个 输入 着 。 
的 情况 。 在 实际 使 用 中 你 可 以 看 到 ， 考 虑 到 “ 非 ” 是 一 个 单 输入 广义 与 门 的 开关 分 析 
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的 “或 非 ”, 我 们 可 以 只 用 或 非 门 来 构建 非 门 。 

我 们 使 用 控制 开关 构建 门 实际 上 是 对 开关 非常 有 限 的 应 用 : 每 个 开关 要 么 是 被 用 作 逆 变 
器 ， 要 么 就 是 用 于 控制 1 和 输出 线 之 间 的 切换 。 我 们 可 以 用 更 少 的 开关 建立 门 ， 但 是 我 们 这 
样 的 设计 可 能 在 现实 世界 中 更 好 实现 ， 因 为 必须 考虑 到 我 们 会 同时 建造 数 百 万 或 数 十 亿 的 开 
关 ， 而 如 何 逐 一 控制 它们 是 个 艰巨 的 任务 。 例 如 ， 每 个 门 的 输出 线 都 有 一 个 到 电源 的 连接 。 

通常 ， 我 们 会 想 在 使 用 更 高 层次 的 抽象 时 我 们 丢失 了 什么 信息 。 实 际 上 这 是 无 法 知道 
的 : 因为 控制 开关 确实 可 以 以 各 种 方式 相互 连接 ， 而 且 它 们 组 成 的 电路 的 行为 也 难以 理解 。 
然而 ， 通 过 布尔 逻辑 我 们 可 以 证 明 ， 任 何 使 用 门 电路 来 构建 的 电路 都 可 以 使 用 控制 开关 电路 
来 搭建 ， 到 之 亦 然 。 

同样 地 ， 我 们 也 总 是 会 考虑 在 使 用 更 高 层次 的 抽象 时 获得 了 什么 。 在 这 种 情况 下 ， 电 路 
分 析 会 变 得 更 容易 和 更 系统 化 ， 但 更 重要 的 是 ， 这 个 抽象 层次 是 深刻 的 ， 因 为 它 把 物质 世界 
与 抽象 世界 分 开 了 。 

向 底层 硬件 的 方向 看 ， 门 电路 的 使 用 使 我 们 免 于 担心 特定 的 复杂 物理 设备 的 行为 。 也 许 
我 们 可 以 使 用 不 同类 型 的 弹簧 、 磁 力 更 大 的 磁铁 ， 等 等 ; 我 们 甚至 可 以 不 使 用 开关 来 构建 门 
电路 。 这 种 在 底层 完全 改变 物理 实现 的 能 力 是 推动 计算 进步 的 根本 力量 ， 几 乎 从 它 诞 生 之 初 
就 开始 了 。 门 电路 已 经 经 历 过 使 用 继电器 、 真 空 管 、 唱 体 管 以 及 其 他 许多 物理 方法 来 实现 。 
在 这 个 过 程 中 我 们 看 到 ， 改 善 一 切 的 一 个 办 法 就 是 做 一 个 更 好 的 开关 。 实 际 上 ， 改 善 一 切 的 
男 一 种 方法 是 建立 一 个 更 好 的 或 非 门 (参见 练习 7.2.2 )。 

往 上 层 电路 设计 的 方向 看 ， 门 电路 的 使 用 将 我 们 的 电路 与 布尔 代数 联系 起 来 ， 布 尔 代数 
是 一 种 完全 成 熟 的 数学 系统 ， 我 们 可 以 利用 它 来 进行 开发 。 这 是 香农 的 见解 。 关 于 布尔 函数 
性 质 的 绩 密 数学 表述 也 帮助 我 们 构建 起 理解 数字 电路 行为 的 基础 。 

每 一 个 门 本 身 就 是 一 个 电路 ， 所 以 我 们 可 以 简明 地 为 我 们 的 电路 抽象 出 一 个 递归 定义 : 

电路 即 通过 导线 将 门 电 路 或 者 小 部 分 导线 网 络 连接 而 成 ， 其 中 一 些 导 线 会 被 作 输入 端 和 
输出 端 。 

尽管 它 已 经 很 简单 了 ， 但 为 了 清晰 起 见 ， 我 们 将 稍微 改进 这 个 定义 ， 因 为 我 们 接 下 来 将 
在 几 个 不 同 的 抽象 层次 上 构建 越 来 越 复 杂 的 电路 。 

用 门 构建 电路 ”从 编写 Java 程序 的 经 验 来 看 ， 通 过 定义 合适 的 接口 并 遵循 相应 的 规定 ， 
你 已 经 充分 理解 了 将 小 程序 构建 成 大 程序 的 强大 功能 。 同 样 的 想法 贯穿 于 硬件 设计 中 。 从 现 
在 开始 ， 我 们 将 通过 将 门 电路 连接 在 一 起 来 开发 更 复杂 的 电路 。 我 们 将 遵循 以 下 约定 : 

。 如 前 所 述 ， 从 电路 顶部 和 左 侧 输 入 ， 自 电路 右 侧 或 底部 


输出 。 ee 
。 一 些 输入 线 被 称 为 控制 线 (control line)， 我 们 将 它们 标 

记 为 粗 体 的 ， 它 们 可 能 以 多 种 方式 贯穿 在 电路 中 。 的 | 
。 门 电路 上 会 标记 它 的 功能 ， 并 按照 接口 的 使 用 方法 进行 ,控制 

连接 线 输入 
MND 


。 所 有 不 在 表层 直接 使 用 的 开关 电路 都 被 称 为 门 。 

例如 ， 右 边 的 电路 由 三 个 与 门 和 一个 或 门 组 成 ， 具 有 三 个 jd 
输入 、 三 条 控制 线 和 一 个 输出 。 区 分 控制 数据 移动 的 输入 线 和 。”。。 /4 门 一 村 
传输 数据 的 输入 线 是 很 有 必要 的 。 为 了 方便 起 见 ， 我 们 允许 控 oe 
制 线 遍布 整个 电路 ， 以 便于 我 们 可 以 在 任何 一 处 都 可 以 与 它们 。。” 门 级 电路 的 解 
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连接 。 这 有 时 违反 了 输入 应 该 来 自 左边 的 规定 ， 但 是 实际 上 这 并 不 影响 对 电路 的 理解 ， 因 为 
我 们 的 约定 实际 的 意义 是 要 求 数据 总 是 从 左 侧 流向 右 侧 ， 而 控制 线 上 的 并 不 是 数据 。 

例子 : 选择 多 路 复 用 器 。 丰 路 选择 多 路 复 用 器 或 简称 为 上 路 多 路 复 用 器 (Kk-way mux) 是 
具有 天 组 输 大 线 和 一 条 输出 线 的 组 合 电路 ， 能 够 将 其 中 一 个 输入 值 转移 到 输出 ， 如 下 所 示 : 


每 组 输入 包括 数据 输入 (data input) 线 和 控制 线 (control line)。 其 
中 控制 线 至 多 有 一 个 为 1， 用 于 选 通 相应 的 输入 到 输出 的 线路 连 
接 。 也 就 是 说 ， 电 路 其 实在 实现 一 个 逻辑 开关 (logical switch) 的 
功能 ， 让 输出 值 与 所 选 的 输入 值 相等 。 我 们 强调 这 是 个 “逻辑 ”上 
的 开关 ， 因 为 我 们 不 希望 导线 在 物理 上 连接 ， 只 是 有 指定 的 值 。 

右 图 中 顶部 的 接口 是 3 路 选择 多 路 复 用 器 的 示例 。 输 入 值 标 
记 为 x、y 和 z， 控 制 线 标记 为 s:、s, 和 s;。 如 果 s; 是 1， 则 电路 将 
输出 值 设置 为 x 的 值 ， 以 此 类 推 。 接 口 还 指定 了 电路 的 大 小 和 形 
状 ， 以 及 输入 和 输出 的 位 置 。 像 往常 一 样 ， 这 些 几 何 约 束 对 于 理解 
电路 的 功能 并 不 重要 ， 但 是 坚持 这 些 几 何 约束 对 于 理解 底层 电路 以 
及 将 其 连接 到 其 他 电路 时 会 更 容易 。 

中 间 的 图 具体 描述 了 如 何 实现 这 一 功能 。 实 际 上 ， 电 路 实现 
的 是 布尔 函数 sx + syy + szz 的 功能 (这 个 图 并 没有 控制 在 至 多 只 有 
一 个 选择 线 是 0， 解决 方案 详 见 练习 7.3.4) 

最 下 面 的 图 比较 直观 ， 我 们 可 以 看 到 下 面 隐藏 的 门 级 电路 是 
如 何 实现 的 。 我 们 经 常会 这 样 做 以 使 我 们 能 够 理 清 整个 电路 的 各 种 
属性 。 例 如 ， 你 可 以 看 到 在 这 个 电路 中 ， 输 入 和 输出 之 间 没 有 任何 
物理 连接 。 

你 在 后 面 的 内 容 中 会 看 到 ， 三 路 选择 复 用 器 不 仅仅 是 一 个 玩 
具 一 样 的 简单 示例 ， 我 们 会 使 用 这 样 的 电路 来 切换 处 理 器 组 件 之 间 
的 逻辑 连接 。 更 直接 地 ， 你 可 以 把 多 路 选择 复 用 器 想象 成 一 种 切换 
机 制 ， 就 像 把 多 种 信号 连接 到 你 的 电视 机 或 计算 机 显示 器 ， 然 后 用 
一 个 切换 器 来 选择 其 中 一 种 信号 进行 显示 (实际 上 ， 这 样 的 多 路 信 
号 选择 器 真 的 存在 ， 而 且 价格 不 贵 )。 

门 电路 设计 以 及 前 面 提 到 的 简单 规定 ， 大 大 简化 了 构建 和 理 
解 电 路 的 过 程 。 大 多 数 人 从 门 电路 开始 学 习 电 路 设计 。 与 软件 一 
样 ， 你 很 快 就 会 习惯 于 在 更 高 的 抽象 层次 上 工作 。 

我 们 的 方法 要 求 在 整个 过 程 遵 循 几何 约束 ， 从 而 略微 增加 了 
复杂 性 ， 但 这 些 额 外 的 工作 产生 了 相当 多 的 好 处 ， 使 得 整个 电路 都 
显得 更 加 有 条 理 。 





一 个 3 路 选择 多 路 复 用 器 


解码 器 、 多 路 分 配器 和 多 路 复 用 器 ”为 了 更 好 地 解释 门 电 路 用 于 电路 设计 的 过 程 ， 我 们 
在 接 下 来 的 例子 中 展示 几 个 完全 由 与 门 构建 的 组 合 电路 (或许 会 用 到 一 个 或 门 )。 这 会 是 你 
学 习 利 用 门 电路 搭建 复杂 电路 的 一 个 良好 开端 。 万 事 开头 难 ， 但 这 个 过 程 其 实 很 容易 理解 。 
这 三 种 电路 都 包含 n 条 自 上 而 下 的 输入 线 ， 内 部 有 2” 个 nn 输 入 与 门 ， 每 一 个 门 都 可 以 按照 
逻辑 实现 对 输入 值 的 传递 或 者 是 取 反 后 传递 。 在 实际 使 用 中 ， 这 些 电 路 也 会 因为 使 用 场景 的 


不 同 、 要 求 的 输 大 或 输出 信号 的 不 同 产生 略微 的 变化 。 
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解码 器 。 解 码 器 是 一 种 组 合 电 路 ， 一 个 具有 nn 条 输入 线 的 解码 器 有 2” 条 输出 线 。 如 果 

我 们 将 输入 看 作 一 串 二 进 制 数字 ， 并 对 所 有 的 输出 线 进 行 编号 ， 那 么 解码 器 的 作用 就 是 选中 
输入 信号 所 指定 的 输出 线 。 具 体 而 言 ， js 实现 
将 nn 个 输入 值 解释 为 n 位 三 进 制 数 i 
并 且 将 输出 线 编号 为 0 至 2"-1， 解码 加 
器 中 所 选中 的 第 i 条 输出 线 的 值 为 1， 
其 他 输出 线 的 值 则 为 0。 如 右 图 所 示 ， 二 
最 左边 的 接口 图 中 画 出 了 3 位 解码 器 -六 
的 大 小 和 形状 ,以 及 其 输入 和 输出 的 
位 置 。 

左 数 第 二 个 图 展示 的 是 如 何 使 用 J 
2" 个 与 门 搭建 n 个 输入 的 解码 器 。 对 
于 每 个 输出 线 ， 仅 有 其 相对 的 一 组 输 
入 值 可 以 使 其 输出 值 为 1。 从 图 中 可 以 回国 
看 到 ， 在 某 个 输出 线 输出 为 1 时 ， 如 | 
果 需 要 相应 的 输入 线 输 入 为 0， 则 对 应 
的 输入 线 上 有 取 反 标记 ; 如 果 需 要 输入 
线 输入 为 1， 则 直接 连接 进 与 门 中 。 左 
数 第 三 个 图 展示 的 是 具体 的 电路 实现 。 在 最 右 侧 的 图 中 ,我 们 对 其 中 的 开关 进行 状态 分 析 ， 
如 电路 将 输入 值 100 解释 为 二 进 制 数 4， 并 将 输出 线 4 的 值 设 置 为 1 (所 有 其 他 输出 为 0 )。 

你 将 在 7.5 节 中 看 到 ， 解码 器 电路 在 我 们 的 处 理 器 中 扮演 着 关键 的 角色 ， 我 们 可 以 将 计 
算 机 指令 中 的 二 进 制 代 码 转换 为 对 应 的 某 根 输 出 线 值 为 1， 从 而 激活 由 二 进 制 码 寻 址 的 电 
路 。 





解码 器 
3 位 解码 器 


在 图 中 同时 还 列 出 了 开关 层级 的 分 析 ， 你 可 以 看 到 每 
接口 实现 个 与 门 是 如 何 响应 给 定 的 一 组 输入 的 。 在 接 下 来 ,我 们 将 
不 再 展示 这 些 电路 内 部 的 原理 图 ， 因 为 我 们 从 门 级 电路 中 
可 以 很 清楚 地 看 见 电路 的 实现 逻辑 。 
多 路 分 配器 。 如 左 侧 图 所 示 ， 一 个 多 路 分 配器 
( demultiplexer, 简称 demux) 是 在 解码 器 的 基础 鞋 再 增加 
一 个 输入 信号 (我 们 称 之 为 输入 值 )， 以 此 形成 一 个 1 对 
2n 的 逻辑 开关 ， 将 输入 值 切 换 到 解码 器 选 定 的 输出 线 上 。 
换 名 话说， 除了 由 地 址 输入 的 二 进 制 值 选 中 的 输出 线 以 
外 ， 其 他 输出 线 均 输 出 0 ;而 对 于 选中 的 那个 输出 线 ， 如 
果 输 入 值 为 0， 则 为 0; 如 果 输 入 值 为 1， 则 为 1。 正 如 
你 所 看 到 的 ， 我 们 通过 给 每 个 解码 器 输出 添加 一 个 与 门 来 
实现 这 一 操作 ， 只 有 输入 值 为 1 时 ， 多 路 分 配器 的 输出 值 
才 为 1。 简单 起 见 ， 我 们 用 与 门 选 取 左 侧 输 入 中 的 一 个 值 
而 不 是 将 输入 值 连接 过 来 ， 如 练习 7.3.2 中 所 述 。 我 们 不 
wa 再 画 出 详细 的 电路 图 细节 ， 因 为 它 与 前 文中 的 解码 器 非常 
3 位 多 路 分 配器 相似 。 
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与 以 前 一 样 ， 请 注意 ， 多 路 分 配器 是 一 个 逻辑 开关 一 一 输入 和 所 选 输出 之 间 没有 物理 连 
接 ,我们 只 是 简单 地 让 选 定 的 输出 具有 与 输入 线 相同 的 值 。 

在 接 下 来 的 7.5 节 我 们 也 会 提 及 ， 多 路 分 配器 会 在 我 们 的 处 理 器 中 发 挥 关键 作用 ， 因 为 
它们 可 以 按照 计算 机 指令 的 控制 ， 将 指令 中 的 二 进 制 数据 值 传导 到 电路 中 的 其 他 部 分 。 

多 路 复 用 器 。 多 路 复 用 器 ( multiplexer, 简称 mux) 是 一 种 组 合 电 路 ， 具 有 n+ 2” 条 输入 
线 和 二 条 输出 线 ; 它 的 作用 是 从 个 输入 值 中 选取 一 个 作为 输出 ， 因 此 可 以 被 看 作 一 个 2" 
对 1 的 逻辑 开关 。 FP 

右边 的 图 展示 了 多 路 复 用 器 的 实现 ， 从 图 中 
可 以 看 到 ， 就 像 在 多 路 分 配器 中 一 样 ， 在 解码 器 的 
基础 上 再 增加 了 一 个 与 门 ， 将 解码 器 的 输出 送 入 与 ”*- 
门 中 ， 并 将 与 门 的 输出 用 一 个 多 路 的 或 门 (在 图 中 a 
垂直 所 放 ) 来 收集 。 或 门 的 输入 中 最 多 只 有 一 个 是 
1 ( 当 且 仅 当 被 寻 址 的 线路 的 输入 为 1 的 情况 )， 因 ，- 
此 输出 值 的 逻辑 是 正确 的 。 例 如 ， 如 果 输 入 xyz 是 
110， 则 输入 行 6 上 的 值 将 出 现在 输出 上 。 像 往常 
一 样 ， 这 是 一 个 逻辑 开关 一 一 在 选 定 的 输入 和 输出 
间 没 有 任何 物理 连接 。 

显然 你 也 可 以 想到 ， 多 路 复 用 器 在 我 们 的 处 理 ~ 
器 中 也 起 着 至 关 重 要 的 作用 ， 因 为 它们 允许 我 们 在 “于 
计算 机 指令 中 使 用 二 进 制 代码 来 指定 用 于 输出 的 数 
据 值 。 
委 直 多 路 单 热 或 门 。 值得 强调 的 是 ， 我们 在 多 。 二 时， 
路 复 用 器 中 用 到 的 垂直 多 路 “或 ” 门 其 实 非常 容易 a 
分 析 ， 因 为 它们 的 输入 始终 满足 一 个 特殊 条 件 : 多 路 或 门 上 的 输入 仅 有 1 路 为 1( 热 )。 我 们 
用 “ 单 热 ”这 个 名 称 来 强调 这 个 不 变 的 特性 。 原 则 上 ， 利 用 这 个 特性 我 们 可 以 制造 很 多 特殊 
的 电路 ， 在 这 里 我 们 使 用 了 二 个 普通 的 多 路 或 门 。 这 个 或 门 正 好 满足 我 们 的 需要 ， 因 为 广义 
“与 ” 门 中 有 且 仅 有 一 个 输出 可 以 为 1 一 一 对 应 于 输入 数据 选中 的 线 。 实 际 上 ， 在 我 们 的 电 
路 设计 中 ， 这 是 唯一 需要 使 用 或 门 的 地 方 。 因 此 ， 当 我 们 提 到 “或 门 ”的 时 候 ， 我 们 就 是 指 
这 样 一 个 门 。 

至 此 ， 我 们 已 经 介绍 了 四 个 经 典 的 组 合 电路 ， 都 是 由 垂直 的 与 门 构建 的 。 为 了 确保 你 可 
以 更 全 面 地 了 解 它们 的 工作 原理 ,我们 花 了 如 此 大 的 篇 幅 来 进行 讲解 这 些 例子 很 好 地 说 明 
了 我 们 在 构建 复杂 电路 时 始终 遵循 的 规定 ， 以 及 这 些 基本 的 电路 将 在 接 下 来 的 7.5 节 构 建 计 
算 机 处 理 器 中 发 挥 着 关键 的 作用 。 更 重要 的 是 ， 充 分 了 解 这 些 电路 的 设计 将 会 更 充分 地 锻炼 
你 对 于 电路 的 抽象 概括 能 力 。 

积 之 和 电路 ”值得 注意 的 是 ， 通 过 扩展 我 们 刚刚 使 用 的 基本 方法 我 们 可 以 将 一 列 与 门 
放 在 一 起 建立 一 个 电路 ， 其 输出 值 可 以 是 输入 值 的 任何 二 个 指定 的 厦 东 子 数 。 我 们 可 以 从 指 
定 函 数 的 真 值 表 直 接 构 建 电路 。 具 体 来 说 ,我 们 需要 完成 以 下 几 点 : 

。 选 定 函数 真 值 表 中 为 1 的 行 。 

。 将 输入 值 连接 到 广义 与 门 ， 使 得 当 且 仅 当 输入 值 为 选取 的 这 些 行 的 值 时 ， 与 门 对 应 的 

输出 值 为 1。 
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。 将 所 有 这 些 门 的 输出 送 入 (垂直 ) 多 路 “或 ” 门 。 

。 将 该 或 门 的 输出 作为 函数 值 。 

这 个 结构 与 我 们 用 于 推导 布尔 函数 的 积 之 和 表达 式 结构 完全 相同 。 

异 或 。 作 为 第 一 个 示例 ， 我 们 来 分 析 下 面 的 结构 ， 这 是 一 个 由 3 个 门 电路 实现 的 两 个 变 


量 的 异 或 函数 。 








站 实现 名 
当 目 仅 当 下 路 
| 输入 值 为 01 
XOR Fx ] 
市 请 网 时 人 为 1 
A 
[区 工作- 泣 | 当 且 仅 当 
区 输入 值 为 10 
Ra 0 ND re 时 ， 值 为 1 
xoR| | 
XOR = Xx'y + Xxy" 
利用 真 值 表 构 建 异 或 电路 


我 们 首先 搭建 xy 和 xy' 对 应 的 广义 与 门 ， 然 后 将 它们 的 输出 送 入 一 个 〈 垂 直 ) 或 门 来 计 
算 x'y+xy'。 如 果 想 验证 一 下 电路 工作 是 否 如 我 们 设计 所 想 ， 你 可 以 参照 下 图 ， 它 会 在 开关 
层面 为 你 分 析 所 有 输入 的 可 能 结果 。 


当 旧 保 当 
险 入 值 为 20 11 
输入 值 为 急 员 中 当 自 仅 当 民 


00 | 01 
01 时 ” 值 为 1 
| , 区 1 信 为 1 上 [Tale i 输入 他 为 全 
110 时 ， 什 为 1 
0 由 es en, 4 wo nd 


稍 后 我 们 会 利用 这 个 电路 实现 我 们 的 计算 机 处 理 器 中 的 按 位 异 或 指令 。 

MAJ 和 ODD。 同 样 ,为 了 计算 3 个 输入 的 MAJ 函数 (MAJ 函数 又 称 为 表决 器 ， 当 且 
仅 当 多 数 输入 为 1 时 输出 为 1 一 一 译 者 注 )， 我 们 可 以 将 计算 x'yz，xy'’z，xyz'" 和 xypz 的 门 到 在 
一 起 ， 然 后 对 输出 进行 或 运算 ， 如 下 所 示 : 





接口 电路 | 


Xxyz 





mal Gd 
X'YZ + XYy'Z + XYZ” + XYZ = MAJ 


利用 真 值 表 构 建 一 个 MAJ 电路 
当然 ,我们 也 可 以 设计 一 个 电路 来 计算 3 个 输入 的 ODD 函数 ， 把 计算 xy'z、x'yz'、 
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1025| xy'z' 和 xyz 的 与 门 的 输出 连接 到 一 个 垂直 的 OR 门 即 可 : 





000 
利用 真 值 表 构 建 一 个 ODD 电路 
显然 ,同样 的 方法 对 于 任何 布尔 阴 数 都 是 有 效 的。 如 果 你 有 一 个 定义 清晰 的 布尔 函数 ， 
那么 你 就 可 以 列 出 它 的 真 值 表 ; 一 旦 你 有 了 真 值 表 ， 你 就 可 以 建立 一 个 电路 来 计算 它 指定 
的 函数 。 有 了 这 个 方法 ,我 们 可 以 很 容易 地 构建 计算 任何 布尔 函数 的 电路 ， 这 件 事 情意 义 
重大 。 
实际 操作 中 的 限制 。 但 是 ， 你 可 能 已 经 注意 到 了 一 个 问题 : 积 之 和 电路 在 计算 输入 量 
较 大 的 布尔 函数 时 构建 电路 将 会 变 得 复杂 ， 因 为 所 需 门 的 数量 可 以 是 输入 数量 的 指数 级 。 例 
如 ， 使 用 这 种 方法 来 计算 64 个 输入 的 表决 器 函数 将 需要 多 于 24 个 门 ， 显 然 这 是 不 可 行 的 ， 
而 这 仅仅 是 这 样 一 个 简单 的 函数 。 上 一 节 我 们 学 过 的 多 路 分 配器 电路 也 有 类 似 的 问题 : 一 
个 却 位 多 路 分 配器 有 2" + 对 + 1 个 输入 ， 所 以 如 果 我 们 要 使 用 这 个 结构 ， 我 们 需要 考虑 一 个 
2”+"+1 行 的 真 值 表 。 这 样 的 电路 显然 是 不 切实 际 的 ， 例如， 我 们 的 4 位 多 路 分 配器 只 需要 
17 个 门 ， 但 是 使 用 积 之 和 电路 设计 方法 的 真 值 表 会 有 200 多 万 行 。 
但 是 ， 积 之 和 电路 在 实际 使 用 中 非常 有 用 。 我 们 可 以 把 电路 设计 的 过 程 想 像 成 一 个 盒 
子 ， 盒 子 里 有 多 个 门 电路 ， 每 一 个 对 应 于 真 值 表 的 一 行 ， 对 于 任何 一 个 布尔 函数 ， 我 们 只 需 
要 将 其 真 值 表 中 为 1 的 行 对 应 的 门 连接 起 来 ， 就 可 以 设计 出 相应 的 计算 电路 ; 也 可 以 想象 一 
[1026] 个 大 的 解码 器 ， 只 需 在 真 值 表 中 对 应 于 0 的 地 方 插入 非 门 。 再 或 者 ， 也 想象 有 一 个 程序 会 自 
动 地 将 真 值 表 转换 成 积 之 和 电路 ， 因 为 它们 只 是 同一 个 抽象 的 不 同 描述 。 实 际 上 ， 这 些 想象 
与 历史 上 某 些 阶段 构建 计算 机 的 方式 并 没有 太 大 区 别 。 
一 般 来 说 ， 我 们 会 使 用 规范 的 布尔 表达 式 来 进行 设计 ， 然 后 再 根据 相关 的 定理 进行 化 
简 ， 以 实现 电路 设计 的 优化 。 通 常情 况 下 ,这 样 的 优化 会 找到 一 种 新 的 电路 设计 方案 ， 比 我 
们 之 前 使 用 积 之 和 电路 方法 所 需 的 门 更 少 。 例 如 ,根据 下 面 这 个 等 式 (你 可 以 用 真 值 表 检 查 
它 的 正确 性 ): 
MAJ(x, y, Zz)= xXy + 十 Zz 
我 们 可 以 立即 给 出 一 个 电路 ， 与 我 们 依据 真 值 表 所 使 用 的 4 个 三 路 “与 ” 门 方案 相 比 ， 它 
只 使 用 了 3 个 两 路 “与 ” 门 ( 见 练习 7.2.4)。“ 电 路 优化 ”这 一 主题 在 计算 科学 的 初期 ( 那 
个 阶段 每 个 门 都 还 是 一 个 独立 的 物理 实体 ) 进行 了 大 量 的 研究 ， 因 此 对 于 许多 常见 的 布尔 函 
数 ， 科 学 家 已 经 知道 如 何 使 用 尽 可 能 少 的 门 来 实现 。 为 了 讲述 清楚 ， 我 们 将 这 些 简化 实现 的 
过 程 放 在 本 章 的 练习 题 中 再 做 分 析 。 
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积 之 和 电路 给 我 们 呈现 了 另 一 个 层次 的 抽象 。 我 们 知道 如 果 能 够 做 出 2 个 门 ， 那 么 我 
们 就 能 够 为 任意 一 个 款 个 变量 的 布尔 逻辑 表达 式 建 立 其 对 应 的 计算 电路 。 这 个 结论 是 我 们 在 
上 一 个 抽象 的 基础 上 的 一 个 很 重要 的 进步 。 在 上 一 个 层次 的 抽象 中 ， 我 们 学 会 了 从 开关 和 电 
线 开始 搭建 电路 ， 并 把 电路 想象 成 一 个 黑 盒 ; 而 这 一 次 ， 我 们 找到 了 一 套 切实 可 行 的 系统 方 
法 用 于 构建 具有 少量 输入 的 布尔 函数 的 电路 ,并 且 我 们 知道 可 以 为 任何 布尔 函数 构建 电路 。 
在 计算 了 高 度 和 宽度 之 后 ， 我 们 可 以 为 任何 布尔 函数 绘制 接口 ， 类 似 于 我 们 为 MAJ 和 ODD 
绘制 接口 图 ( 当 输 入 数量 很 大 时 ， 我 们 需要 找到 一 些 方法 来 减少 资源 使 用 。) 

我 们 在 本 节 中 分 析 的 所 有 电路 都 是 有 用 的 ， 但 它们 执行 的 计算 都 相 。，， 
对 简单 。 接 下 来 ,我 们 分 析 一 个 电路 ， 它 执行 我 们 在 日 常生 活 中 会 遇 到 
的 计算 任务 : 将 两 个 n 位 数 相 加 。 :入 

加 法 器 ”让 我 们 仔细 研究 将 两 个 二 进 制 数 字 相 加 的 过 程 ， 使 用 你 在 


c4 53 5Cz Ci co 一 进位 


小 学 时 学 到 的 方法 。 右 边 是 一 个 计算 5 + 6 = 11 的 图 ， 用 4 位 二 进 制 数 。 加 总 xz、 输入 位 


表示 : 0101 + 0110 = 1011。 图 的 下 半 部 分 定义 出 了 任意 4 位 二 进 制 加 法 子 到 天 3 输出 位 
中 各 个 位 的 符号 名 称 。 4 位 加 法 

通常 ，4 位 加 法 器 电路 将 具有 8 个 输入 位 zaxzxixo 和 yayzyiyo、4 个 
输出 位 23222120， 并 且 还 有 5 个 进位 C4C3C2C1C0o 可 以 把 C0 看 作 一 个 额外 的 输入 值 (我 们 设 为 
0 )， 并 把 cs 作为 一 个 额外 的 输出 值 (我 们 可 以 忽略 它 ， 或 者 用 来 检测 是 否 发 生 溢 出 )。 

基于 积 之 和 电路 的 实现 (草案 )。 一 个 位 加 法 器 可 以 用 n+ 1 个 组 合 电路 (每 个 输出 位 
对 应 一 个 ) 来 实现 ， 每 个 电路 具有 2n + 1 个 输入 。 我 们 可 以 考虑 用 积 之 和 电路 来 实现 , 但 
是 ， 由 于 真 值 表 有 2”*' 行 ， 所 以 我 们 还 是 放弃 了 这 种 方法 。 存 在 这 样 的 想法 是 很 好 的 ,但 
是 我 们 必须 找到 一 个 使 用 合理 数量 的 门 的 电路 实现 。 

波纹 进位 加 法 器 (ripple-carry adder)。 相 反 ， 我 们 开发 一 个 电路 ， 它 采用 人 类 计算 两 个 二 
进 制 数字 之 和 的 方法 。 在 上 面 的 例子 中 ， 首 先 你 将 最 右 一列 的 1 和 0 相 加 (以 及 隐 含 的 进位 ， 
在 这 里 是 0 ) 以 得 到 一 个 最 右边 的 输出 位 1 和 一 个 进位 0 ;其 次 右面 的 第 二 列 0 和 1 再 加 上 前 
一 位 的 进位 0， 得 到 输出 位 1 和 另 一 个 进位 0 ; 然后 把 这 个 进位 加 到 从 右 数 第 三 列 的 两 个 输入 
1， 得 到 输出 0 和 进位 1; 最 后 把 这 个 进位 加 到 两 个 最 左边 的 输入 0， 得 到 输出 1 和 进位 0。 

对 于 每 一 位 的 运算 ， 这 个 计算 过 程 等 价 于 两 个 三 输入 的 布尔 运算 值 : 计算 输出 位 和 下 一 
位 的 进位 。 那 么 ， 这 两 个 计算 的 布尔 函数 是 什么 ? 

。 对 于 进位 ， 如 果 三 个 输入 位 中 1 的 个 数 为 0 或 1， 则 进位 为 0， 如 果 输 入 位 中 1 的 个 

数 是 2 或 3， 则 进位 为 1， 这 是 一 个 三 位 的 表决 器 函数 (majority function ) 。 

。 对 于 输出 位 ， 如 果 三 个 输入 位 中 1 的 个 数 为 1 或 3， 则 输出 为 1， 如 果 输 入 位 中 1 的 

个 数 是 0 或 2， 则 输出 位 为 1， 这 是 三 位 的 奇偶 校 验 函 数 (odd parity function)。 

由 此 ， 我 们 可 以 写 出 下 图 左边 中 的 布尔 算式 ， 这 些 算式 可 以 告诉 我 们 如 何 根据 输入 值 
和 进位 值 使 用 布尔 函数 运算 来 得 出 每 一 个 输出 值 。 根 据 这 些 算式 ， 我 们 就 可 以 构建 出 一 个 4 
位 加 法 器 的 草案 图 ， 如 算式 的 右边 所 展示 的 那样 。 我 们 使 用 4 个 表决 器 函数 和 4 个 奇偶 校 验 
函数 组 件 ， 按 照 这 些 算式 所 示 的 方式 连接 在 一 起 。 这 个 结构 就 是 我 们 所 说 的 波纹 进位 加 法 器 
(又 称 串 行进 位 加 法 器 一 一 译 者 注 )。 从 右边 开始 ， 首 先 我 们 提供 输入 co、xo 和 yo 进入 右边 的 
MAJ 和 ODD 电路 ， 计 算 进 位 ci 和 输出 zo。 然 后 cl、 zi 和 六 输入 到 MAJ 和 ODD 电路 ， 计 
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算 进位 cx 和 输出 z1， 等 等 。 从 右 到 左 依次 计算 ， 像 泛 起 的 波纹 一 样 。 

现在 计算 机 中 已 经 据 弃 了 这 种 波纹 式 的 串 行 方法 而 采用 了 更 复杂 的 加 法 器 实现 ， 从 而 
在 计算 较 多 位 数 的 加 法 时 获得 更 好 的 性 能 。 但 是 我 们 的 电路 很 好 地 说 明了 计算 机 在 执行 计算 
时 的 基本 思路 。 请 注意 ， 在 这 里 我 们 在 构建 电路 时 又 提高 了 一 个 层次 : 因为 这 一 电路 是 由 
MAJ 和 ODD 电路 构建 的 ， 而 MAJ 和 ODD 是 由 门 级 电路 构建 的 。 


C1 = MAJ (Xo, Yo, Co) 
C2 = MAJ (xi,yY1s C2) 
C3 = MAJ (X,Yy2, Cz) 
CH = MAJ(X3,Y3, C3) 


Zo = ODD(xo, yos Co) 
Zz2 = ODD(X1,y1s C1) 
Zi = ODD(X2,y2, C2) 
Z3 = ODD(X3,Y3; C3) 
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当 4 位 加 法 器 的 输入 被 设置 为 执行 计算 5+6= 11 时， 下 图 在 开关 级 分 析 和 展示 了 底层 
电路 上 所 有 连 线 上 的 值 ， 这 非常 值得 仔细 研究 。 
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一 个 4 位 加 法 器 计算 5 + 6 = 11 的 开关 级 电路 分 析 
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这 种 结构 可 以 很 轻松 地 扩展 到 位， 构建 的 电路 中 有 2n + 1 条 输入 线 和 n+ 1 条 输出 
线 ， 可 以 实现 将 两 个 却 位 数 相 加 ， 而 只 需要 使 用 8n 个 通用 的 AND 门 和 2n 个 多 路 OR 门 。 
也 就 是 说 ， 我 们 的 4 位 加 法 器 有 40 个 门 ，32 位 加 法 器 只 有 320 个 门 。 当然 ， 这 些 数字 比 我 
们 之 前 所 用 的 2” 行 的 真 值 表 (这 将 涉及 超过 9 x 10” 个 门 ) 的 方法 要 简洁 许多 。 

算术 J 逻辑 单元 (ALU) 为 了 给 像 TOY 机 这 样 的 机 器 构建 一 个 ALU， 我 们 需要 一 个 设备 
来 实现 这 些 算 术 和 逻辑 指令 : 加 (add)， 减 (subtract)， 与 (and)， 异 或 (exclusive or)， 左 移 
(shift left)， 右 移 ( shift right)。 为 描述 简单 并 能 够 突出 构建 过 程 的 重点 ,我 们 将 以 TOY-8 为 
例 进行 讲解 。TOY-8 是 第 6 章 未 尾 提 到 的 TOY 系列 计算 机 的 成 员 之 一 ， 在 7.5 节 中 我 们 将 详 
细 介 绍 它 的 实现 。 对 于 ALU 来 说 ， 这 意味 着 我 们 只 需要 实现 加 、 减 、 与 、 异 或 的 功能 。 我 
们 已 经 学 习 了 所 有 我 们 需要 的 基本 电路 的 实现 方法 ; 现在 我 们 将 看 到 如 何 把 它们 整合 在 一 起 ， 
组 成 一 个 独立 的 设备 ， 它 的 输入 端 为 两 个 nn 位 三 进 制 值 和 3 个 控制 线 ， 输 出 端 为 到 位 二 进 制 
值 (我 们 忽略 加 法 器 的 进位 输入 和 进位 输出 )。 控 制 线 的 目的 是 选择 所 需 的 计算 结果 做 输出 。 

位 操作 。 按 位 与 (and) 和 蜡 或 (exclusive or) 电路 实现 起 来 非常 简单 ， 如 下 图 所 示 。 对 
于 “与 ”"”，， 我 们 简单 地 用 一 个 与 门 来 表示 每 一 位 。 对 于 “ 异 或 ”"， 我 们 使 用 前 面 例子 中 提 到 的 
XOR 积 之 和 电路 ， 每 一 位 对 应 一 个 这 样 的 电路 。 


实现 


AND AND AND 


AND | | | | 
Z z. z Zz 


























! ! | 开关 级 别 分 析 (0101^0110 = 0011) 


Zi 
oe Ne 0100) 器 | 中 


4 位 按 位 与 的 电路 实现 4 位 按 位 异 或 门 电 路 

输入 。 我 们 的 加 法 器 、 按 位 与 和 按 位 异 或 电路 都 采用 了 相同 的 输入 。 从 三 个 电路 的 接 
口 图 中 可 以 看 到 ， 它 们 的 输入 数据 从 左 侧 穿 过 整个 电路 ， 这 使 得 它们 可 以 左 侧 对 齐 堆 生 在 一 
起 。 我 们 对 所 有 电路 都 使 用 了 这 样 的 设计 ， 以 方便 将 相同 的 输入 数据 传输 到 每 个 电路 。 

输出 。 三 个 电路 的 输出 都 是 nn 个 值 (加 法 器 还 有 进位 )， 但 我 们 只 会 选择 一 组 值 作 为 
ALU 一 次 计算 的 输出 。 为 此 ， 我 们 只 须 将 三 个 输出 的 每 一 个 对 应 位 连接 到 一 个 三 路 的 多 路 
选择 复 用 器 (我 们 讲 过 的 第 一 个 门 级 电路 )， 并 将 控制 线 同 时 接 通 这 些 多 路 选择 复 用 器 ， 使 
得 选 定 操作 的 计算 结果 成 为 多 路 复 用 器 的 输出 。 

将 这 些 部 分 放 在 一 起 ， 就 可 以 为 TOY-8 绘制 一 个 完整 的 8 位 ALU， 如 后 图 所 示 。 它 实 
现 了 加 法 、 按 位 与 、 按 位 异 或 的 操作 ， 有 16 路 输入 ， 并 生成 8 路 输出 ， 具 体 的 计算 功能 由 
3 条 控制 线 指定 。 当 控制 线 中 仅 有 一 个 是 1 时， 输出 就 是 被 选中 的 电路 的 计算 输出 。 有 趣 的 
是 ,不 管 哪个 计算 电路 被 控制 线 选中 ， 其 他 电路 结果 也 是 计算 完成 了 的 ， 只 是 被 忽略 而 已 。 
由 此 得 出 : 你 的 计算 机 正在 计算 大 量 完 全 被 忽略 的 结果 ! 
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如 果 将 门 级 电路 的 实现 都 揭 开 ， 就 能 看 到 所 有 的 细节 ， 而 ALU 本 身 在 这 个 抽象 层次 上 
最 好 理解 。 同 时 ， 你 也 可 以 看 到 每 一 个 开关 在 计算 中 发 挥 的 作用 。 但 这 里 我 们 不 再 详 述 ， 在 


本 章 结尾 我 们 设计 一 个 完整 的 处 理 器 时 ， 你 将 看 到 所 有 的 开关 。 


这 个 电路 本 质 上 与 你 的 计算 机 中 的 ALU 基本 
相同 ， 因 此 通过 仔细 研究 ， 你 可 以 了 解 你 的 计算 机 
是 如 何 执行 算术 运算 的 。 你 的 计算 机 可 能 有 更 多 的 
组 件 ， 一 次 能 够 计算 更 多 的 位 ， 但 是 你 也 会 看 到 如 


何在 这 两 个 维度 上 扩展 我 们 的 设计 。 右 表 给 出 了 该 ”3 路 复 用 器 


设计 用 于 大 位 ALU 所 需要 的 门 级 电路 的 数量 。 


加 法 器 
异 或 


与 


4n 
18n 


72 


144 


256 
1152 


这 个 ALU 的 设计 是 一 个 激动 人 心 的 过 程 ， 也 ”一 个 位 算术 逻辑 单元 (ALU) 中 门 的 数量 
是 对 我 们 抽象 能 力 的 证 明 ， 更 是 我 们 对 组 合 电路 研究 的 一 个 总 结 。ALU 模块 在 任何 计算 机 
处 理 器 中 都 扮演 着 极其 重要 的 角色 ， 我 们 将 在 7.5 节 讲 解 TOY-8 电路 的 过 程 中 再 着 重 分 析 它 








/> 
的 实现 过 程 。 
XYyy XeYe Xsys Xe XY XY2 
| 
MAJ MAJ MA MAJ MAJ 
OpD 0ODD 0ODD OpD ODD 
XOR XOR XOR 
| 
AND AND 
了 WAY | 3-WAY | 3-WAY | 3-WAY | 3-WAY | 
zy Ze Zs 24 Zz 
一 个 8 位 算术 逻辑 单元 


XOR 


模块 和 总 线 我们 已 经 看 到 ,组 合 电 路 让 计算 机 拥有 了 计算 布尔 函数 的 能 力 ， 因 此 ， 它 
们 在 “微观 ”级 别 的 计算 电路 中 扮演 着 重要 的 角色 。 接 下 来 我 们 讨论 它们 在 “宏观 ”层面 所 
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起 的 关键 作用 ， 即 将 电路 的 主要 部 分 连接 在 一 起 。 为 此 ， 我 们 需要 引入 一 些 新 的 术语 。 

模块 。 在 构建 计算 机 的 过 程 中 ,需要 构建 电路 以 
实现 计算 机 的 各 种 抽象 组 件 ， 如 我 们 需要 构建 存储 器 、 
寄存 器 和 ALU 等 。 我 们 使 用 术语 模块 (module) 来 指 
代 这 样 的 电路 (通常 这 些 电 路 实现 了 计算 机 的 某 个 基本 
零件 ， 用 于 完成 某 个 基本 功能 )。 出 大 意料 的 是 ,在 典 
型 的 计算 机 中 ， 模 块 数量 通常 非常 少 。 

总 线 连 接 。 我 们 使 用 总 线 (bus) 将 数据 从 一 个 模 
块 传输 到 另 一 个 模块 。 总 线 其 实 就 是 一 些 简 单 的 导线 
组 。 我 们 有 时 也 把 总 线 当 作 数 据 通路 (data path)， 以 便 
明确 它们 的 用 途 : 在 计算 过 程 中 ， 数 据 沿 总 线 从 存储 右 
传送 到 寄存 器 ， 从 寄存 器 传送 到 ALU， 从 寄存 器 传送 
到 存储 器 等 。 为 了 更 好 地 使 用 总 线 ， 我 们 将 输入 和 和 输 
出 线路 整合 在 一 起 ， 以 建立 总 线 连接 (bus connection )， 
而 不 再 为 每 个 输入 输出 设备 各 自 建 立 独立 的 输入 线 或 
输出 线 。 例 如 ， 右 图 展示 了 我 们 的 ALU 电路 的 输入 和 
输出 总 线 连接 。 像 往常 一 样 ， 我 们 把 输入 放 在 左上 方 ， 
输出 放 在 右 下 方 。 通 过 这 些 总 线 连接 ， 我们 可 以 轻松 | We | 
地 将 ALU 连接 到 其 他 电路 模块 。 Ss ss 

总 线 开关 复 用 器 。 作 为 一 个 典型 实例 ,我 们 考虑 ” : 
这 样 一 个 组 合 电 路 ， 它 以 m 个 宽度 为 n 的 总 线 (总 线 的 5 六 
宽度 为 总 线 中 的 导线 数量 ) 作为 输入 ， 并 为 整个 总 线 实 4 位 算术 逻辑 单元 的 总 线 连接 
现 一 个 逻辑 开关 , 能 够 将 其 中 一 条 总 线 切 换 为 输出 。 为 
了 选择 要 切换 的 总 线 ， 我们 使 用 m 条 控制 线 ， 并 假设 它们 中 至 多 有 一 条 是 1， 用 于 选中 对 应 于 
该 控制 线 的 总 线 并 将 其 切换 至 输出 。 在 下 面 图 示 中 ， 上 半 部 分 画 出 了 一 个 宽度 为 4 的 总 线 和 一 
个 2 路 开关 的 接口 示意 图 ， 下 半 部 分 绘制 了 一 个 宽度 为 8 的 总 线 和 一 个 3 路 开关 的 接口 图 。 


用 于 4 位 总 线 的 2 路 开关 
输入 总 线 "和 


选取 的 “ 
控制 线 ， 


SMe 2 








2 路 总 线 复 用 器 三 输出 总 线 
3 路 总 线 复 用 器 
输入 总 线 : 和 
用 于 8 位 总 线 ， 
的 3 路 开关 


3 路 总 线 复 用 器 看 输出 总 线 
总 线 复 用 器 接口 1035 
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实现 非常 简单 ， 就 是 对 3 路 开关 复 用 器 的 简单 应 用 ， 总 线 中 的 每 一 根 线 都 连接 到 一 个 复 
用 器 ， 就 像 我 们 的 ALU 底部 的 复 用 器 使 用 一 样 。 我 们 将 每 个 位 的 输出 线 连接 到 一 个 多 路 选 
择 复 用 器 (这 是 我 们 学 习 的 第 一 个 门 级 电路 )， 并 将 多 路 选择 复 用 器 的 控制 线 贯 穿 在 一 起 进 
行 选择 。 如 此 一 来 ， 选 中 的 总 线 对 应 的 值 将 作为 这 个 复 用 器 的 输出 ， 出 现在 输出 总 线 上 。 下 
面 展示 的 是 一 个 8 位 的 3 路 总 线 多 路 复 用 器 的 实现 ， 图 的 下 方 是 开关 分 析 示 例 。 确 保 自己 看 
懂 了 这 个 电路 的 工作 原理 ， 这 一 点 至 关 重 要 ! 在 7.5 节 中 分 析 CPU 的 电路 设计 时 ， 这 种 连 
接 和 控制 的 方式 也 会 发 挥 重 要 的 作用 。 





用 于 选择 
的 控制 线 “ 


3-WAY 3-WAY 3-WAY 3-WAY 3-WAY 3-WAY 3-WAY 3-WAY 
一 一 一 -一 -- 一 一: 一 一 = - 













二 -二 二 








控制 线 1 的 值 
为 1; 所 以 输出 总 线 
值 即 是 输入 总 线 1 的 值 





一 个 8 位 的 3 路 总 线 复 用 器 ( 实现 、 电 路 和 示例 ) 


同样 ， 总 线 复 用 器 是 逻辑 开关 一 一 从 输入 线 到 输出 线 之 间 没 有 任何 物理 连接 。 但 如 果 不 
考虑 电路 的 转换 时 间 ， 电 路 操作 就 好 像 它们 连接 在 一 起 似 的 。 

抽象 层次 ”虽然 我 们 一 直 是 在 利用 电线 和 开关 建立 电路 ,但 实际 上 我 们 已 经 经 历 了 三 个 
不 同 的 抽象 层次 : 

。 门 (gate) 是 由 开关 构成 的 电路 ， 如 “与 门 ”或 “或 非 门 ”。 

。 门 级 电路 (gate-level circuit) 是 由 门 构成 的 电路 ， 如 MAJ、ODD 或 解码 器 电路 。 

。 模块 ( module) 是 由 组 件 或 门 构建 的 电路 ， 具有 输入 输出 总 线 和 控制 总 线 以 便 连接 到 

其 他 模块 ， 如 ALU 或 总 线 复 用 器 。 

事实 上 ,我们 现在 已 经 了 解 了 电路 的 内 部 结构 ， 我 们 可 以 使 用 由 总 线 、 控 制 线 和 规定 好 
尺寸 的 接口 ， 在 模块 这 个 抽象 层面 构建 我 们 的 电路 ， 如 后 图 所 示 。 每 一 个 模块 都 将 在 我 们 的 
计算 设备 中 发 挥 关 键 作用 ， 并 且 我 们 只 需要 在 抽象 层面 理解 每 个 模块 的 功能 和 设计 标准 就 可 
以 完成 电路 的 设计 。 

从 这 个 层面 来 看 ， 我 们 不 必 考 虑 如 何 构建 模块 ， 但 是 我 们 必须 了 解 它们 的 功能 。 当 然 你 
应 该 能 够 理解 后 图 中 每 个 模块 的 基本 功能 。 
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我 们 讨论 的 所 有 的 门 电路 都 应 该 满足 的 一 条 属性 是 “输出 仅 取 决 于 输入 ”。 因 此 ， 我 们 
所 考虑 的 所 有 组 件 和 模块 都 具有 相同 的 属性 : 它们 是 组 合 电路 。 在 下 一 节 中 ,我 们 将 考虑 时 
序 电路 (sequential circuit)， 它 们 的 物理 状态 (和 输出 ) 取决 于 输入 值 的 变化 。 

就 像 在 开发 软件 时 一 样 ， 我 们 在 构建 电路 时 也 会 将 电路 进行 抽象 。 这 有 助 于 我 们 将 问题 
简化 ， 并 且 它 可 以 将 功能 实现 部 分 和 使 用 接口 设计 进行 分 离 ， 这 与 构建 软件 有 着 诸多 的 相同 
点 。 只 要 模块 的 使 用 者 和 功能 实现 部 分 的 外 部 接口 (也 就 是 输入 线 和 输出 线 ) 保持 一 致 ， 我 
们 就 可 以 独立 地 测试 和 调试 模块 ， 更 好 地 实现 功能 并 能 够 复 用 模块 。 

布局 。 电 路 比 软件 更 接近 于 物理 世界 。 其 实在 定义 电路 的 尺寸 和 输入 输出 线 的 位 置 时 ， 
我 们 已 经 在 接口 中 包含 了 布局 信息 。 我 们 总 是 利用 现 有 的 物理 模块 建立 一 个 更 高 级 别 的 电 
路 ， 而 这 种 模型 表示 方法 很 直观 地 表达 了 这 种 工作 方式 。 只 要 模块 的 输入 线 和 输出 线 处 于 同 
一 位 置 ， 我 们 就 可 以 拔 下 一 个 旧 模 块 并 插入 新 模块 。 


加 法 器 


DA 
DDN wwh 记 口 





组 合 电路 模块 接口 


如 果 我 们 完全 忽略 布局 约束 ， 组 合 电路 和 布尔 函数 之 间 几 乎 没有 什么 差别 。 就 像 我 们 在 
加 法 器 中 所 用 的 MAJ 函数 和 ODD 函数 ， 它 们 的 布尔 方程 其 实 与 对 应 电路 中 所 用 的 门 电路 
以 及 元 件 是 等 价 的 。 布 尔 函 数 的 表示 方法 非常 严谨 ， 也 是 很 有 价值 的 ,但 是 它们 与 物理 电路 


1037 


1038 


1039 


1040 


606 移 7 章 


相差 甚 远 。 我 们 使 用 的 带 有 布局 信息 的 抽象 表示 方法 是 一 个 折 中 方案 。 在 进行 电路 设计 的 过 
程 中 ， 有 时 我 们 可 能 完全 忽略 抽象 层 的 设计 ， 只 关注 于 开关 、 导 线 这 些 实现 的 细节 ; 有 时 我 
们 可 能 会 使 用 完全 的 抽象 表示 法 ， 然 后 将 模块 的 布局 和 摆 放 视 为 另外 一 个 独立 的 任务 。 我 们 
的 方法 将 电路 分 为 两 个 部 分 : 一 个 是 布尔 函数 部 分 ,一 个 是 物理 电路 部 分 (这 一 部 分 你 只 能 
在 援 开 计算 机 后 才能 看 到 )， 然 后 又 把 这 两 部 分 有 机 结合 起 来 。 

如 果 你 还 不 能 理解 我 们 之 前 所 讲 的 在 几 个 不 同 的 抽象 层次 构建 电路 的 方法 (包括 真 值 
表 、 积 之 和 表示 法 、MAJ 和 ODD 函数 以 及 它们 如 何 对 应 到 加 法 电路 设计 中 的 应 用 )， 那 么 
再 试图 理解 ALU 电路 如 何 工 作 就 会 变 得 十 分 困难 。 同 时 ， 理 解 物理 电路 的 工作 原理 也 很 重 
要 。 对 于 每 个 特定 的 计算 ,在 开关 和 导线 级 分 析 哪 些 线 的 值 是 1， 哪 些 线 的 值 是 0， 是 非常 
有 意义 的 训练 ， 它 可 以 让 你 对 如 何 将 算法 构建 成 具体 的 电路 有 更 加 细致 而 深入 的 理解 。 

我 们 抽象 出 的 电路 模型 是 矩形 ， 其 输入 和 输出 位 于 矩形 的 边 ， 但 对 于 我 们 来 说 这 种 抽 
象 的 思想 远 比 这 些 抽象 模型 本 身 重 要 。 我 们 也 可 以 考虑 开发 其 他 不 同形 式 的 抽象 模型 ， 比 如 
输入 和 输出 可 以 出 现在 电路 中 任何 地 方 ， 或 者 将 电路 画 成 三 维 的 ， 模 块 表示 成 平行 六 面体 ， 
等 等 。 

如 果 我 们 想 构 建 一 人 台 计 算 机 ， 那 么 我 们 就 一 定 要 把 之 前 所 设计 的 那个 抽象 计算 模型 在 物 
理 世 界 中 建造 出 来 。 如 果 我 们 在 物理 世界 中 可 以 轻易 地 制造 出 容纳 指数 级 门 电路 的 芯片 ， 那 
么 我 们 就 可 以 简单 地 用 积 之 和 电路 来 构建 所 有 的 组 合 电路 ; 如 果 很 容易 决定 如 何 布置 模块 和 
电线 ， 那 么 我 们 就 可 能 不 需要 探讨 电路 该 如 何 布局 。 我 们 所 描述 的 这 种 抽象 思想 是 建立 在 我 
们 对 物理 世界 的 理解 不 断 深入 的 基础 上 的 。 事 实 上 ， 现 代 计 算 机 的 设计 和 制造 都 是 基于 电路 
图 的 ， 这 些 电 路 图 严格 规定 了 每 根 导线 的 位 置 ， 以 及 连接 到 导线 上 的 每 个 元 件 的 尺寸 和 位 
置 ， 与 我 们 所 使 用 的 图 没有 太 大 差别 。 这 些 图 是 生产 制造 处 理 器 芯片 过 程 的 输入 ， 而 这 些 必 
片 正 是 现代 计算 机 或 移动 设备 的 核心 。 

半 个 多 世纪 以 来 ， 当 一 项 新 技术 出 现时 (即使 是 简单 物理 开关 的 新 实现 )， 人们 已 经 能 
够 很 快 地 利用 它 来 构建 新 的 电路 ， 并 层 层 改进 它 的 软件 系统 和 应 用 。 这 种 能 力 推动 了 计算 应 
用 的 普及 ， 也 算是 对 抽象 设计 方法 的 力量 的 最 终 证 明 。 

我 们 在 后 面 一 节 里 将 再 次 展示 抽象 设计 方法 的 力量 ， 你 将 看 到 我 们 使 用 十 几 页 的 内 容 来 
描述 一 个 完整 的 ALU 电路 ， 既 能 清楚 地 表示 它 的 功能 和 逻辑 ， 也 能 够 描述 电路 的 基本 属性 。 
问答 环节 

问 : 真正 的 计算 机 也 是 这 样 设计 的 吗 ? 

答 : 我 们 在 设计 的 过 程 中 忽视 了 许多 物理 限制 。 但 是 ， 过 去 绝 大 多 数 的 计算 机 基本 上 都 
是 按照 这 样 的 逻辑 设计 的 ， 现 代 计算 机 也 基本 上 是 这 样 的 。 

问 : 这 样 做 有 什么 缺陷 吗 ? 

答 : 我 们 这 么 做 的 目的 是 使 你 理解 电路 ， 而 非 设计 电路 。 如 同 在 学 习 Java 的 过 程 中 ， 
最 开始 只 是 让 你 读 懂 一 些 程序 ， 而 非 自 己 设计 程序 。 当 你 编程 时 ， 面 对 一 张 白 纸 你 可 能 会 写 
下 一 些 Java 代码 ， 但 未 必 如 你 想象 得 那样 简洁 和 准确 。 这 同样 适用 于 抽象 层 和 接口 的 设计 。 
一 旦 我 们 固定 一 个 接口 ， 我 们 就 会 发 现 它 在 设计 中 的 问题 ; 我 们 可 能 需要 仔细 地 分 析 ， 大 量 
的 重复 验证 ， 比 较 不 同 设计 方案 的 优 劣 ,最终 得 出 一 个 有 效 的 接口 设计 规范 。 与 软件 一 样 ， 
我 们 需要 制定 许多 设计 规则 ， 在 电路 设计 中 你 必须 遵守 它们 。 

问 : 香农 的 名 字 似 乎 之 前 出 现 过 ? 他 是 做 什么 的 ? 
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答 : 香农 是 信息 论 之 父 。 信 息 论 是 研究 信息 表达 的 学 科 ， 它 是 通信 和 机制、 数据 表达 ， 以 
及 电子 信息 时 代 其 他 许多 重要 领域 的 基础 。 

问 : 我 的 计算 机 里 的 加 法 器 是 一 个 波纹 进位 加 法 器 吗 ? 

答 : 可 能 不 是 。 现 代 计 算 机 通常 会 使 用 一 个 更 复杂 的 模型 ， 以 加 快 处 理 进程 ， 其 处 理 时 
间 与 位 数 的 对 数 成 正比 。 

问 : 为 什么 不 使 用 多 路 复 用 器 来 实现 总 线 多 路 复 用 器 呢 ? 

答 : 其 实 是 可 以 的 。 但 是 通常 情况 下 我 们 的 控制 线 是 独立 的 ， 而 不 是 三 进 制 编码 的 ， 所 
以 ， 本 节 中 讲解 的 这 个 模型 更 方便 一 些 。 参 见 练习 7.3.16。 


练习 


7.3.1 在 一 个 输入 /关闭 开关 里 ,假设 输入 值 为 x， 控 制 值 为 y， 写 出 输出 的 布尔 表达 式 。 
答案 : 使 用 “与 非 ” 表 达 式 : xy'。 根 据 我 们 的 规则 ， 以 下 两 个 电路 是 相等 的 ( 当 且 仅 当 x 为 1， 
上 为 0 时 ,输出 值 为 1): 


我 们 使 用 左边 的 图 ， 以 确保 输入 的 对 称 性 ， 并 能 避免 混淆 哪个 导线 是 控制 线 。 在 实际 的 电 
路 设计 中 ， 我们 会 尽 可 能 避免 将 值 在 输入 和 输出 间 直 接 传 递 ， 以 保证 所 有 电路 输出 都 取决 于 相 
邻 的 电源 点 ， 而 不 是 从 输入 端 产 生 的 电流 。 你 可 以 将 我 们 前 面 使 用 到 的 扩展 的 或 非 门 看 作 一 连 
串 这 样 的 电路 连接 到 一 个 非 门 上 。 
7.3.2 ”根据 上 一 题 的 思路 ,设计 一 个 只 有 两 个 开关 的 与 门 。 
答案 : 将 上 面 电 路 的 y 值 取 非 。 根 据 我 们 的 规则 ， 当 和 且 仅 当 x 和 ? 均 为 1 时， 电路 输出 值 为 1。 


ee 


7.3.3” 仅 使 用 与 非 门 ( 详 见 练习 7.3.1 的 右 图 )， 如 何 构 建 非 门 、 或 非 门 、 或 门 、 与 门 和 扩展 的 与 门 。 

7.3.4 设计 一 个 3 路 的 开关 电路 ， 当 且 仅 当 一 个 选择 线 的 值 为 1 且 对 应 的 输入 为 1 时 ,输出 为 1。 与 
7.3 节 正 文 电路 不 同 : 当 有 两 个 输入 线 的 值 为 1 且 两 个 选中 线 为 上 时 ， 输 出 应 该 为 0。 

7.3.5 描述 以 下 操作 的 结果 : 将 一 个 多 路 分 配器 的 输出 与 一 个 同 规格 的 多 路 复 用 器 的 输入 连接 ， 并 将 
它们 的 地 址 线 连 接 到 相同 的 输入 线 上 。 

7.3.6 证 明 : MAJ(x, 多 3)=z 节 +x2 二 节 2 并 设计 一 个 只 有 3 个 双 输入 的 与 门 、2 个 双 输 入 的 或 门 的 电 
路 以 计算 MAJ。 

7.3.7 ”设计 一 个 三 输入 ODD 的 电路 ， 使 用 少 于 5 个 门 。 

7.3.8 ”设计 两 个 电路 ， 用 双 输 入 的 NAND 门 实现 双 输 入 的 XOR 函数 。 在 第 一 个 电路 中 ， 可 以 将 任 一 
NAND 门 输入 连接 到 1 或 者 0。 在 第 二 个 电路 中 ， 所 有 NAND 门 的 输入 都 需要 连接 到 电路 输入 
或 者 另 一 个 NAND 门 的 输出 。 

7.3.9 画 出 真 值 表 以 证 明 : 

MAJ(x, y, 2) = (x, y, 2)(x' +y+2) (x +y'+2) (x+y+2") 

7.3.10 证 明 : 每 一 个 布尔 函数 都 可 以 表示 为 一 个 和 之 积 电路 ， 其 中 求 和 部 分 可 以 是 输入 信和 号 或 者 输入 

信号 取 反 ， 就 像 上 一 题 的 表达 式 那 样 。 
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基于 上 一 练习 ， 设 计 一 个 和 之 积 电路 方法 ， 并 用 这 个 方法 为 ODD 设计 一 个 电路 。 

为 练习 7.1.12 中 三 参数 的 多 路 复 用 器 设计 一 个 积 之 和 电路 ， 并 为 相同 函数 给 出 一 个 仅 使 用 3 
个 门 的 电路 实现 。 

使 用 上 一 练习 中 的 3 门 电路 ,在 输出 的 基础 上 再 设计 一 个 电路 ,该 电路 将 它 的 4 位 输入 顺序 
反 转 后 输出 。 注 意 : 还 可 以 使 用 同样 的 思路 设计 出 一 个 计算 任意 输入 序列 的 反 转 电路 。 

设计 具有 四 个 输入 参数 的 门 电路 ， 将 前 两 个 参数 ( w, x) 和 后 两 个 参数 (y, z) 分 别 作为 一 个 2 
位 的 三 进 制 数 字 ， 当 上 且 仅 当 wx > yz 时， 输出 为 1。 

修改 正文 中 的 加 法 器 电路 ,将 原先 的 进位 输出 替换 为 溢出 输出 : 如 果 最 左边 的 进位 输入 与 其 进 
位 输出 相同 ， 则 输出 为 0 ; 若 不 同 ， 则 为 1。 并 证 明 ， 这 样 的 修改 同样 适用 于 n 位 二 进 制 补 码 
数字 表示 法 。 

设计 一 个 2” 路 总 线 多 路 复 用 絮 ， 其 选中 的 输入 为 m 条 线 ， 输 入 的 值 为 选中 线 的 三 进 制 编码 。 
假设 一 个 开关 完成 其 开关 状态 切换 所 花费 的 时 间 为 + (整个 导线 上 立刻 就 能 体现 出 值 的 变化 )。 
计算 以 下 电路 在 输入 值 变 化 时 完成 全 部 的 状态 反应 所 需 的 最 长 时 限 。 


a. NOR b. NAND 

c. 3-WAY d. DECODE 
e. MUX f. MAJ 

g. ODD h. n 位 加 法 器 


设计 一 个 4 位 宽 的 自 增 电路 。 

答案 : 修改 正文 中 的 加 法 器 ， 使 其 进位 输入 为 1 : 设 xzaxaxixo 为 数字 ，csc3czc1 为 进位 ，z3z2z1zo 
为 输出 。 当 且 仅 当 x 位 值 为 1 且 有 进位 输入 为 1 时， 则 向 下 一 位 进位 〈 即 与 操作 ); 当 且 仅 当 x 
位 值 和 进位 输入 均 为 1， 或 者 均 为 0 时 ,输出 为 0; 如 果 一 个 为 0， 一 个 为 1， 则 输出 为 1。 因 
此 ,我们 可 以 使 用 加 法 器 的 电路 略 做 修改 ， 用 与 门 作 为 进位 逻辑 ， 用 XOR 门 构建 求 和 部 分 。 


C1 = AND(xo, 1) 
C2 = AND(x1, C1) 
C3 = AND(x,, C2) 
Cs = AND(x;, C3) 


Zo = XOR(xo, 1) 
Z2 = XOR(X1, C1) 
Zi; = XORCx2 C2) 
Zz3 = XOR(x3, C3) 





一 个 4 位 波纹 进位 增 量 器 


创新 练习 


7.3.19 


7.3.20 


7.3.21 


设计 一 个 门 。 开 发 一 个 Java 程序 ， 使 其 可 以 设计 一 个 n 位 扩展 的 与 门 电路 ， 与 正文 中 描述 的 
设计 相同 。 从 命令 行 中 输入 一 个 小 于 2" 的 非 负 整数 ， 用 这 个 整数 的 三 进 制 表示 方法 中 1 的 位 
置 来 指定 取 反 的 位 置 。 

设计 一 个 解码 器 。 开 发 一 个 Java 程序 ， 使 其 可 以 设计 一 个 n 位 的 解码 器 。 可 以 在 上 一 题 答案 
的 基础 上 开发 你 的 程序 。 

设计 一 个 积 之 和 电路 。 开 发 一 个 Java 程序 ,使 其 可 以 设计 一 个 n 位 的 积 之 和 电路 。 从 命令 行 
中 输入 一 个 在 0 和 22 之 间 的 一 个 整数 ， 使 用 这 个 整数 的 二 进 制 表示 方法 来 指定 给 出 函数 值 的 
真 值 表 列 。 
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7.3.23 


7.3.24 


TH25 


7.3.26 


7.3.27 


7.3.28 


设计 一 个 加 法 器 。 开 发 一 个 Java 程序 ,使 其 可 以 设计 一 个 nn 位 的 加 法 器 ， 与 正文 中 描述 的 设 
计 相 同 。 可 以 在 上 一 题 答案 的 基础 上 开发 你 的 程序 。 

比较 器 。 设 计 一 个 电路 ， 有 两 个 n 位 的 输入 和 1 位 输出 ,将 两 个 输入 看 作 二 进 制 整数 ， 当 第 
一 个 小 于 第 二 个 时 输出 为 1。 夯 出 n= 4 时 的 电路 ， 并 给 出 一 个 nn 的 函数 用 于 计算 实现 该 电路 
所 需 的 门 的 数量 。 

门 的 通用 集 。 门 的 通用 集 是 指 : 若 仅 使 用 导线 和 集合 中 的 门 就 可 以 实现 所 有 布尔 函数 的 电路 表 
示 ， 那 么 这 个 集合 就 是 通用 的 。 我 们 的 积 之 和 电路 构建 方法 表明 ， 广 义 的 多 路 门 都 是 通用 的 
(这 没什么 惊喜 的 ， 因 为 有 这 么 多 类 型 的 门 )。 假 设 : 非 门 仅 有 一 个 输入 ， 而 所 有 其 他 的 门 都 只 
有 两 个 输入 ,那么 以 下 选项 中 哪个 是 通用 的 ? 并 证 明 其 余 选 项 不 是 通用 的 。 


a.NOT and AND b. NOR 
c.NAND d. AND and OR 
e. NOT and OR f. AND and XOR 


开关 的 通用 性 。 证 明 : 在 组 合 电路 中 开关 和 门 是 等 价 的 ， 即 对 于 任意 给 定 的 由 电线 、 通 断 开 
关 、 输 入 /关闭 开关 组 成 的 网 络 ， 可 以 建立 一 个 由 门 构成 的 计算 网 络 ， 其 在 相同 的 输入 时 总 是 
产生 相同 的 输出 ， 反 之 亦 然 。 提 示 : 将 上 一 题解 法 中 加 入 与 非 门 。 

右 移 位 。 构 建 一 个 4 位 的 右 移 位 电路 。 假 设 输入 线 为 xoxixzxx;3， 输 出 线 为 zoz1z2z3， 控 制 线 为 
so515253， 当 控制 线 中 仅 有 一 个 为 1 时 ， 该 线 所 在 的 位 置 对 应 的 数值 作为 移 位 的 参数 将 输入 数据 
右 移 。 基 于 以 下 四 个 布尔 公式 来 完成 你 的 设计 。 

20 三 Xoso 

Zi = X081 + XiSo 

Z2 = X052 + XI1S1 + X2S0 

2Z3 = X053 中 X152 十 X251 上 X350 

其 中 ， 你 可 以 轻易 证 明 : 当 so 作为 选中 的 控制 线 时 ，zoziz2zs 即 为 xoxix2zx3 ; 当 3 作为 选中 的 控 
制 线 时 ，zoziz223 为 0xoxix2; 当 s; 作 为 选中 的 控制 线 时 ，zoz1z2z3 为 000xo。 

答案 : 





Zz 


一 个 4 位 右 移 位 
右 移 位 电路 分 析 。 将 练习 7.3.26 中 的 右 移 位 电路 做 一 个 备份 ， 并 分 析 这 个 电路 计算 
1001>>2=0010 的 过 程 ， 将 计算 时 值 为 1 的 导线 加 粗 标 出 。 

左 移 位 。 根 据 上 一 题 中 描述 的 右 移 位 的 方法 ， 给 出 一 个 左 移 位 的 布尔 公式 ， 其 中 : 输入 为 


1045 


1046 


1047 
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Xxoxix2x3， 左 移 位 选择 totits， 输 出 为 zoz1z2z3。 注 意 到 上 题 的 电路 图 中 对 角 线 下 方 几乎 是 空白 
的 ， 如 何在 这 个 电路 图 的 空白 区 域 添加 部 分 电路 ， 就 能 构建 一 个 可 以 向 任 一 方向 移 位 的 电路 。 
假设 8 条 控制 线 sogiszgs 和 totitzts 中 至 多 有 一 个 为 1。 

7.3.29 “算术 移 位 。 对 于 正 整数 ， 右 移 位 与 被 2 的 寡 次 方 相 除 是 一 样 的 ; 左 移 位 与 被 2 的 寡 次 方 相 乘 是 
一 样 的 。 设 计 一 个 移 位 器 ， 可 以 对 任意 二 进 制 整数 (可 以 是 正 数 也 可 以 是 负数 ) 计算 乘法 或 者 
除法 ， 假 设 数据 使 用 二 进 制 补 码 法 表示 ， 电 路 应 包括 一 个 输出 ， 用 于 表示 溢出 。 画 出 当 关 = 4 
时 的 电路 图 ,在 设备 级 抽象 表示 即 可 。 

7.3.30 “位 的 统计 。 设 计 一 个 电路 ， 有 元 位 输入 ， 并 将 输入 中 工 的 个 数 的 二 进 制 表示 方法 作为 输出 。 
画 出 n= 4 时 的 电路 ( 门 级 抽象 ) 并 给 出 一 个 元 的 函数 ， 用 于 计算 实现 该 电路 所 需 的 门 的 
数量 。 

7.3.31 乘法 器 。 交 蔡 地 使 用 移 位 和 加 法 ,就 能 够 实现 两 个 位 二 进 制 数字 的 乘法 。 按 照 这 个 原理 可 
以 设计 乘法 器 电路 。 画 出 n= 4 时 的 电路 (组件 级 抽象 )， 并 给 出 一 个 n 的 函数 ,用 于 计算 实现 
该 电路 所 需 的 门 的 数量 。 

7.3.32 “平面 计算 机 。 在 前 面 的 电路 绘制 过 程 中 ， 你 需要 在 一 个 平面 上 将 多 个 门 用 导线 连接 起 来 ， 而 
导线 之 间 是 不 可 以 交叉 的 。 如果 不 得 不 产生 导线 交叉 ， 可 以 使 用 一 个 专用 的 电路 模块 来 实现 ， 
这 个 模块 的 内 部 没有 导线 交叉 ， 完 全 使 用 门 电路 来 实现 ， 它 的 功能 是 输入 信号 xx 和 了 分 别 在 模 
块 的 左 侧 和 上 方 ， 而 右 侧 的 输出 值 为 x, 下 方 的 输出 值 为 y。 画 出 这 个 模块 的 实现 。 


7.4 时 序 电路 


在 本 节 中 我 们 将 会 看 到 当 电 路 有 回路 或 反馈 (feedback) 时 将 会 发 生 什 么 。 实 际 上 , 我 
们 只 会 考虑 一 些 简 单 的 例子 ， 因 为 由 反馈 引入 的 复杂 性 比 我 们 在 Java 程序 中 添加 循环 和 条 
件 引 入 的 复杂 性 还 要 大 。 因 此 在 电路 中 ， 我们 严格 限制 反馈 电路 。 

首先 ， 我 们 只 考虑 最 简单 的 门 电路 上 形成 的 反馈 ， 由 两 个 开关 形成 最 基本 的 回路 电路 。 
值得 注意 的 是 ， 这 样 的 回路 使 得 我 们 可 以 构建 一 种 全 新 的 电路 类 型 一 一 内 存 ( memory)。 我 
们 会 重点 关注 如 何 为 这 些 电路 添加 控制 线 ， 从 而 精确 控制 存储 的 数据 值 。 在 本 节 中 我 们 考虑 
的 所 有 电路 都 仅 限制 在 单个 基本 循环 中 进行 反馈 。 理 解 反馈 的 机 制 是 理解 计算 机 内 存 实现 原 
理 的 关键 。 存 储 器 以 字 节 形式 存储 ， 字 节 由 位 构成 ， 而 位 是 由 反馈 回路 实 站 
现 的 。 和 

在 下 一 节 中 ,我 们 讲解 大 型 电路 元 件 之 间 的 大 型 反馈 回路 ( macro 
feedback loop)。 最 终 ， 我 们 的 计算 设备 中 只 可 以 有 少数 这 样 的 循环 ， 并 且 WT、 ， 
我 们 能 够 准确 地 控制 它们 的 行为 。 

基本 反馈 电路 ”我们 首先 来 分 析 两 个 可 能 是 最 简单 的 反馈 回路 。 第 一 《 


个 只 有 一 个 开关 ; 第 二 个 有 两 个 。 
蜂 鸣 器 。 我 们 来 分 析 右 侧 所 示 的 电路 ， 其 中 开关 的 输出 被 反馈 到 其 控 中 ] 
制 输入 端 。 如 果 输 出 是 1 (顶部 )， 那 么 控制 输入 也 是 1， 这 会 导致 开关 将 输 Ny 

出 变 为 0。 但 是 一 旦 开关 完成 这 个 工作 (底部)， 控 制 输入 也 变 成 0， 这 导致 蜂 鸣 器 示例 
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开关 再 次 将 输出 变 为 1 (顶部 )。 这 是 一 个 不 稳定 的 情况 ， 因 为 开关 始终 处 于 一 个 循环 当中 ， 
不 停 地 翻转 输出 的 值 (以 及 控制 输入 的 值 )， 而 且 翻 转速 度 就 是 物理 设备 的 最 快速 度 。 这 样 
的 电路 被 称 为 蜂 鸣 器 (buzzer)。 旧 式 门铃 就 是 由 这 样 一 个 模块 配合 继电器 开关 构成 的 : 继 电 
器 的 输出 端 连接 到 控制 输入 端 ， 电 磁铁 触 点 来 回 摆动 会 产生 喻 喻 声 。 
具有 反馈 的 稳定 电路 。 例 如 右边 的 有 反馈 回路 ， 它 由 两 


R 的 输出 作 关 
个 互联 的 开关 组 成 ， 每 个 开关 的 输出 端 都 连接 到 另 二 个 开 的 控制 入 入 
关 的 控制 线 。 我 们 将 这 种 连接 方式 定义 为 交 又 境 合 (ress- ”1 首先 。 La 
coupled)a 如 图 所 示 ， 交 又 耦合 环 路 具有 两 种 形式 ， 具 体 取决 ”切断 输 出 、 有 
于 开关 的 操作 顺序 。 假 设 电 源 关 闭 (所 有 电线 的 值 均 为 0 )， \ 
然后 打开 开关 。 上 面 的 图 描述 了 当 开 关 工 在 开关 R 之 前 接 通 二 
(即使 具有 很 短 的 时 间 )， 将 会 发 生 什么 情况 : 按照 其 控制 线 的 首先 R 的 控制 输入 
控制 ， 开 关 工 将 其 输出 设置 为 0， 这 意味 着 开关 R 的 控制 是 0， dn 
因此 开关 R 的 输出 是 1， 这 使 得 开关 L 保持 工作 状态 (将 其 输 了 
出 设置 为 0 )， 这 是 一 个 稳定 的 状态 。 下 面 的 图 描述 了 当 开 关 Da 
R 中 的 电源 首先 被 打开 的 情况 ， 你 可 以 按照 相同 的 逻辑 分 析 将 
会 发 生 什么 。 无 论 哪 种 方式 ， 电 路 都 是 稳定 的 : 只 要 第 一 个 开 交 对 烛 全 8 阁 


关连 接 到 电源 ， 什 么 都 不 会 改变 。 我 们 期 望 所 有 的 电源 都 在 同一 时 刻 开启 ， 但 实际 主 我 们 
无 法 控制 这 样 一 个 电路 可 能 到 达 的 状态 。 我 们 要 做 的 第 一 件 事 就 是 增加 控制 线 来 纠正 这 种 
情况 。 

这 两 个 例子 说 明了 当 我 们 在 开关 电路 中 引入 反馈 时 产生 的 两 种 具有 本 质 区 别 的 模型 。 构 
建 复杂 电路 需要 更 多 的 精力 ， 所 以 我 们 要 确保 能 够 理解 和 掌握 这 些 较 小 的 组 件 ， 并 基于 它们 
构建 更 大 的 电路 组 件 ， 如 同 构 建 组 合 电路 的 过 程 一 样 。 幸 运 的 是 ， 正 如 你 将 在 本 节 中 看 到 
的 ， 通 过 在 最 简单 的 稳定 状态 电路 《 即 两 个 交叉 耦合 开关 ) 上 添加 控制 线 ， 就 可 以 提供 足够 
的 灵活 性 ， 使 我 们 能 够 为 计算 机 构建 存储 器 电路 。 

触发 器 - 通过 在 我 们 的 交叉 耦合 电路 中 增加 两 个 控制 输入 ， 我 们 可 以 创建 一 个 触发 器 
(flip-fop)， 这 就 是 我 们 的 一 个 内 存 位 的 基本 实现 。 控 制 线 的 用 途 正如 它 的 名 称 一 样 : 控制 
电路 到 达 两 种 状态 中 的 哪个 。 当 我 们 希望 电路 选择 其 中 一 个 状态 时 ， 我 们 
激活 相应 的 控制 线 ;， 当 我 们 想 要 在 男 一 个 状态 时 ， 我 们 激活 另 一 个 控制 ”接口 
线 。 当 然 ， 我们 可 以 这 样 理解 . 其 中 一 个 状态 理解 为 0， 男 一 个 状态 就 表 | 
示 1， 这 样 通过 这 种 方式 添加 两 条 控制 线 就 可 以 实现 一 个 内 存 位 (a bit of 
memory)， 我 们 可 以 借助 控制 线 将 它 设置 为 0 或 1。 

上 述 描述 的 功能 其 实 很 好 实现 ， 如 右 图 所 示 。 我 们 在 每 个 电源 节点 的 ”5R 


ee 


前 面 添加 二 条 控制 线 ， 并 在 底部 输出 一 个 输出 值 。 按 照 惯例 ， 我 们 将 控制 i 
线 分 别 标记 为 $ (用 于 置 位 ， 来自 于 Set 的 首 字 母 ) 和 及 (用 于 复位 ， 来自” 电路 
于 Reset 的 首 字 母 )。 通 常 ， 我 们 使 用 交叉 耦合 的 NOR 门 来 实现 (参见 练 


习 7.3.1 )， 该 电路 被 称 为 SR 触发 器 (SR flip-flop)。 接 下 来 ,我 们 在 开关 
层面 来 分 析 它 们 的 功能 。 
置 位 。 要 置 位 一 个 触发 器 〈 输 出 值 为 1 的 稳定 状态 )， 我 们 只 需 将 $ 
控制 线 的 值 设 为 1 的 时 间 足 够 长 ， 足 以 打开 阻塞 与 右 侧 电源 节点 相连 接 的 输出 
开关 ， 这 会 使 输出 线 的 值 设 为 1， 这 个 值 为 一 直 保 持 下 来 ， 即 使 控制 线 S ”一 个 SR 触发 器 
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Wi So 值 变 为 0， 如 左 图 所 示 。 一 定 要 理解 这 点 ， 这 是 理解 计算 机 


如 何 存储 信息 的 关键 。 
复位 。 要 复位 一 个 触发 器 (输出 值 为 0 的 稳定 状态 )， 我 
们 将 R 控制 线 的 值 提高 到 1 to 足以 打开 阻塞 与 


| t 
输出 为 1 输出 保持 1 


左 侧 电源 节点 相连 接 的 开关 ， 这 会 使 输出 线 的 值 设 为 0， 这 


置 位 触发 器 个 值 为 一 直 保 持 下 来 ， wrt 0。 这 种 情况 如 


R 为 1 R 变 为 0 左 图 所 示 。 


我 们 允许 R 和 S 控制 信号 都 是 0， 但 是 我 们 并 不 希望 它 


称 为 竞争 条 件 (race condition)， 因 为 两 个 开关 将 比赛 谁 会 第 


| | 
] 荆 们 都 置 为 1， 这 将 导致 我 们 无 法 控制 输出 的 值 。 这 种 情况 被 
ee 


有 | 一 个 被 输出 。 我 们 在 电路 设计 中 应 该 避免 这 样 的 情况 出 现 。 
入 二 触发 器 的 意义 不 仅仅 在 于 它们 很 简单 ， 更 在 于 每 一 个 触 


发 器 都 实现 了 内 存 位 ， 这 是 计算 中 最 基本 的 抽象 单元 。 实 际 


上 ,这 种 内 存 位 的 实现 非常 简单 ， 令 人 难以 置信 的 是 ， 几 十 年 来 ， 触发 器 一 直 是 计算 机 内 存 
的 基础 模块 。 接 下 来 ,我 们 加 入 能 控制 内 存 位 输入 的 控制 线 ， 来 实现 计算 机 处 理 器 的 寄存 器 


和 主 存储 器 部 分 。 

寄存 器 ”在 下 一 级 抽象 中 ,我 们 增加 了 两 条 控制 线 来 构建 基于 触 
发 器 的 寄存 器 位 (register bit)。 然 后 ， 我 们 将 一 系列 寄存 器 位 串 起 来 作 
为 一 个 寄存 器 (register)。 寄 存 器 是 每 台 计 算 机 的 重要 组 成 部 分 ; 就 像 
TOY 机 中 的 各 个 寄存 器 ， 如 PC 或 R[0] 至 R[F]。 

寄存 器 位 。 我 们 的 目标 是 实现 以 下 功能 : 首先 ， 我们 希望 可 以 通 
过 一 条 独立 的 输入 线 来 传输 想 要 存储 的 值 ; 其 次 ， 我 们 希望 有 一 个 写 
入 (write) 控制 线 ， 以 精准 控制 在 某 一 个 时 刻 当 它 的 值 变 化 时 ， 我 们 将 
输入 的 值 保存 下 来 。 右 图 给 出 了 实现 电路 ， 这 个 电路 控制 S 和 R 信和 号 
如 下 所 示 : 

。 当 且 仅 当 写 人 控制 线 是 1 并 且 输 入 线 是 1 时 ，S 是 1。 

。 当 且 仅 当 写 和 人 控制 线 为 1 并且 输入 线 为 0 时 ，R 为 1。 

我 们 会 按照 统一 的 方式 设置 寄存 器 中 的 值 。 其 中 时 序 的 控制 非常 
重要 ， 如 下 图 所 示 。 首 先 ， 我 们 确保 输入 线 上 存在 输入 值 。 然 后 我 们 
将 控制 线 置 1， 但 是 置 1 时 间 不 用 很 长 ， 只 要 能 够 保证 开关 操作 可 以 置 
位 或 复位 触发 器 即 可 。 


变 为 | 


值 为 0 无 变化 没 轩 到 |1 
( 写 入 为 0 ) 


将 寄存 器 置 位 为 1 


pa 





Si 


le 


值 f 中 村 为 ] 
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值 
将 寄存 器 置 位 为 1 ( 续 ) 


我 们 需要 控制 时 序 的 原因 是 ,我们 必须 考虑 到 触发 器 值 的 变化 可 能 影响 输入 线 上 值 变 化 
的 这 种 可 能 性 ， 比 如 在 一 个 包含 大 量 线路 和 开关 的 长 反馈 回路 中 就 可 能 出 现 这 种 情况 。 事 实 
上 ， 这 种 反馈 是 我 们 计算 设备 的 一 个 重要 组 成 部 分 。 幸 和 运 的 是 ， 这 种 写 人 控制 机 制 足以 让 我 
们 在 电路 中 解决 这 个 问题 。 

寄存 器 。 寄 存 器 位 使 我 们 能 够 实现 寄存 器 (register)。 下面 是 一 个 8 位 寄存 器 的 例子 。 
它 包括 左上 方 的 8 条 输入 线 、 右 下 方 的 8 条 输出 线 和 一 条 贯穿 寄存 器 的 写 人 控制 线 。 对 
于 接口 部 分 的 实现 ,我们 只 需 并 排放 置 n 个 寄存 器 位 ,将 它们 的 输入 端 连接 到 顶部 的 总 
线 上 ， 将 它们 的 输出 端 连接 到 底部 的 总 线 上 ， 并 将 写 人 连接 到 一 起 ,使 控制 线 能 够 贯穿 每 
一 位 。 








8 位 寄存 器 


寄存 器 的 写 入 。 按 照 前 面 描述 的 内 存 位 的 写 入 脉冲 (write pulse)， 我 们 以 完全 相同 的 
方式 控制 寄存 器 的 时 序 ， 如 下 图 中 所 示 的 4 位 寄存 器 ; 在 上 方 图 中 ， 寄 存 器 保存 的 值 是 
1100， 同 时 ， 输 入 线 上 的 值 是 0101。 由 于 写 人 控制 线 是 0， 输 出 线 仍 保 持 值 1100， 即 寄存 
器 存储 的 内 容 。 当 写 人 脉冲 (很 短暂 ) 变 为 1 时， 在 中 间 的 图 中 ， 新 值 0101 被 存储 在 寄存 
器 中 并 立即 出 现在 输出 线 上 。 在 最 下 方 的 图 中 ， 当 写 人 脉冲 变 为 0 时， 即使 输入 线 上 有 不 
同 的 值 ， 寄 存 器 和 输出 线 上 的 值 仍 保 持 为 0101。 新 的 值 将 不 会 被 加 载 ， 直 到 写 入 控制 再 次 
变 为 1。 

在 大 多 数 计算 机 的 处 理 器 中 ， 寄 存 器 都 起 着 重要 的 作用 。 它 们 存储 着 内 部 处 理 器 的 信 
息 ， 就 像 TOY 计算 机 中 的 程序 寄存 器 PC 或 指令 寄存 器 IR ; 它们 还 用 于 实现 程序 算术 运算 
的 寄存 器 ， 如 TOY 中 的 R[0] 至 RIF]。 在 我 们 的 电路 中 ， 两 种 情况 的 实现 和 操作 是 相同 的 。 
每 个 寄存 器 在 其 触发 器 中 保存 值 ， 且 这 些 值 都 可 以 在 输出 线 上 可 用 。 当 写 和 人 脉冲 到 来 时 ， 输 
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入 线 上 的 值 被 存储 在 寄存 器 触发 器 中 。 你 将 会 看 到 ， 这 个 简单 的 接口 足以 让 我 们 实现 一 个 典 


型 的 计算 机 处 理 器 的 所 有 功能 。 
寄存 器 内 容 为 1100， 输 入 值 为 0101 
于 二 一 一 一 一 
写 入 为 0 
REGISTER 输出 为 1100 
写 入 
写 入 为 1 
REGISTER = 三 输出 变 为 0101 
寄存 器 内 容 为 0101， 新 输入 值 为 0100 
写 入 为 0 
REGISTER ES 三 输出 依然 为 0101 
[1053 | 一 个 4 位 寄存 器 ， 在 写 入 脉冲 时 的 开关 状态 分 析 


内 存 我们 的 下 一 个 时 序 电 路 是 内 存 (memory)。 从 硬件 实现 的 角度 来 看 ， 内 存 只 是 一 
个 可 寻 址 的 寄存 絮 序 列 。 如 果 我 们 的 字 大 小 是 n， 并 且 在 我 们 的 计算 机 指令 中 使 用 m 个 地 址 
位 ， 那么 我 们 有 2” 个 内 存 字 ， 每 个 字 包 含 n 位 。 内 存 字 的 原理 类 似 于 一 个 寄存 器 ， 只 是 附 
加 了 寻 址 /选择 机 制 。 

接口 。 一 个 内 存 有 m+n 个 输入 入 个 输出 ， 输 入 包括 m 个 地 址 位 入 个 输入 位 。 写 入 
控制 信号 线 控制 写 人 的 时 序 ， 就 像 寄 存 右 一 样 。 我 们 希望 它 有 如 下 功能 : 

。 地 址 字 的 内 容 始 终 在 输出 线 上 有 效 。 

。 在 写 入 控制 线 上 产生 有 效 信 号 脉冲 时 ,输入 线 上 的 值 被 存储 到 地 址 字 中 。 

可 以 看 到 ， 一 个 这 样 的 内 存 中 会 拥有 2” 个 字 ， 存 储量 相当 大 ， 因 此 存储 相关 的 模块 占 
据 了 芯片 很 大 的 一 部 分 。 

位 片 设 计 。 我 们 的 设计 是 经 典 的 位 片 内 存 〈 即 内 存 中 所 有 字 的 同一 个 位 会 放 在 一 起 处 
理 一 一 译 者 注 )， 我 们 在 每 一 个 位 的 位 置 上 使 用 相同 的 电路 : 用 多 路 分 配器 选择 一 个 位 进行 
写 操作 ， 用 多 路 复 用 器 选择 一 个 位 进行 读 操 作 ， 如 后 图 所 示 ( 你 可 能 需要 回顾 前 文中 的 多 路 
分 配器 和 多 路 复 用 器 相关 内 容 )。 每 个 位 的 位 置 垂直 方向 依次 排列 ， 左 边 是 多 路 分 配器 ,， 右 
边 是 多 路 复 用 器 。 相 同 的 输入 地 址 同时 驱动 多 路 分 配器 和 多 路 复 用 器 ， 因 此 只 有 在 地 址 字 中 
的 位 才 是 有 效 的 (换言之 ， 它 会 受 输 入 的 影响 或 影响 输出 )。 将 n 个 这 样 的 电路 组 合 在 一 起 
形成 一 个 n 位 字 的 存储 ， 应 注意 此 时 只 有 被 寻 址 的 字 才 是 有 效 的 。 

内 存 仅 有 一 个 写 入 控制 线 ， 该 线 用 作 多 路 分 配器 的 输入 ， 并 被 切换 到 被 选中 的 地 址 字 上 


欧 建 计算 谈 备 615 


每 位 的 写 入 控制 线 。 当 一 个 写 入 脉冲 传 入 内 存 中 时 ， 即 会 传输 到 地 址 字 的 每 位 (而 且 仅 有 那 
些 位 )， 从 而 使 得 输入 值 可 以 对 存储 单元 进行 置 位 或 复位 。 内 存 值 随时 可 以 被 读 取 ， 因 为 每 
位 的 多 路 复 用 器 总 是 可 以 输出 被 寻 址 位 的 触发 器 的 输出 值 。 
电路 实现 。 由 于 存储 单元 占用 太 多 的 空间 ， 我 们 用 简化 的 设计 来 构建 电路 ; 
。 我们 不 再 为 每 位 都 配置 一 个 多 路 分 配器 ， 而 是 总 共 配 置 一 个 ， 并 使 得 每 一 个 输出 都 水 
平地 穿 过 内 存 字 的 每 一 位 。 
。 我们 将 多 路 复 用 器 的 与 门 集 成 到 寄存 器 位 中 ， 从 而 使 得 每 一 个 内 存 位 都 具有 了 自己 的 


选 通 控制 线 (select control line ) 。 1 
2 位 输 位 位 置 n-1 位 位 置 n-2 位 位 置 ; 位 位 置 0 


内 存 
字 0 


内 存 


字 1 






内 存 
字 2" 


n 位 输 


nfi/ 字 出 总 线 


位 片 内 存 示意 图 1055 
这 些 简化 的 设计 使 得 一 个 “位 片 ”的 宽度 缩减 为 之 前 设计 所 需 宽度 的 约 五 分 之 一 (这 是 
非常 有 必要 的 ， 因 为 你 将 会 看 到 ， 即 使 这 样 它 仍然 占据 了 处 理 器 设计 图 的 一 整 页 纸 )。 这 样 
的 设计 实现 了 与 之 前 完全 相同 的 内 存 接口 ， 因 此 了 解 这 些 通 信 的 细节 变 得 不 那么 重要 。 如 果 
你 有 兴趣 ， 可 以 在 本 节 最 后 的 问答 环节 中 找到 一 些 答 案 。 
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内 存 位 。 如 前 所 述 ， 我们 的 内 存 是 由 内 存 位 ( memory bit) 构成 的 ， 这 些 内 存 位 是 寄存 
器 位 加 上 选 通 控制 线 (用 于 读 取 ) 构成 的 。 如 果 选 通 控制 线 本 身 的 值 为 0， 则 输出 为 0; 如 
果 选 通 控 制 线 为 1， 则 输出 是 触发 器 的 值 。 为 了 实现 这 种 行为 ,我 们 只 需 将 触发 器 的 输出 与 
选择 线 进行 “与 ”运算 来 计算 内 存 位 从 而 进行 输出 ， 如 右 图 所 示 。 对 于 每 位 的 位 置 ， 这 些 输 
出 被 传送 到 垂直 或 门 ， 多 路 复 用 器 的 功能 就 是 接收 这 些 位 的 值 并 将 其 中 一 个 作为 输出 值 。 选 
通 线 的 作用 是 确保 除了 被 选取 的 那 条 线 外 ， 其 余 线 的 值 均 为 0。 光志 

内 存 电路 。 我 们 用 构建 寄存 器 相同 的 方式 构建 每 个 内 存 字 : 输入 
将 每 位 水 平 摆 放 ， 并 把 它们 的 控制 线 连接 起 来 ， 使 得 控制 线 贯 “号 入 二 
穿 内 存 字 的 每 位 。 然 后 我 们 通过 垂直 堆 秋 内 存 字 来 建立 内 存 。 
后 文 图 展示 了 一 个 具有 四 个 6 位 字 (m=2 和 n=6) 的 内 存 的 实 
现 。 每 个 字 的 地 址 为 两 位 即 00、01、10 和 11。 应 该 注意 到 这 个 


电路 有 以 下 特点 : g 

。 每 位 对 应 于 一 条 输入 线 ， 从 顶部 的 总 线 引 出 来 垂直 贯穿 党 En 
这 一 个 位 片 。 

。 一 个 电路 同时 实现 了 解码 器 和 多 路 分 配器 功能 (只 有 被 寻 RS 

址 的 那 两 个 输出 是 有 效 的 )。 | 

。 写 人 控制 线 和 地 址 线 驱动 解码 器 /多 路 分 配器 ， 其 输出 针 [村 伴 

对 每 个 内 存 字 的 写 信 线 和 选 通 控制 线 ， 这 两 条 线 会 水 平 | 
贯穿 每 个 内 存 字 的 每 位 。 | 

。 一 个 垂直 或 门 用 来 采集 每 位 的 输出 。 一 

。 底 部 的 总 线 用 于 输出 ， 每 位 对 应 一 行 。 一 一夫 


为 了 更 好 地 理解 内 存 的 写 入 操作 ， 字 10 在 该 图 中 被 突出 显 
示 (并 且 展 示 了 每 位 的 电路 细节 )。 在 这 个 例子 中 ， 输 入 总 线 的 
值 为 001111， 地 址 位 为 10， 写 入 控制 线 为 1， 因 此 内 存 字 10 的 写 和 信和 选 通 线 都 是 1， 它 将 
触发 器 的 值 设 为 001111 (从 右 向 左 读 )， 并 将 这 些 值 传递 到 垂直 OR 门 中 并 最 终 传送 到 输出 
总 线 。 

总 之 ， 这 种 内 存 设计 产生 的 电路 具有 m 个 地 址 输入 、n 位 输入 和 输出 总 线 ， 以 及 一 个 写 
入 控制 线 。 它 的 功能 如 下 : 

。 地 址 字 的 内 容 总 是 会 出 现在 输出 总 线 上 。 

。 每 次 产生 写 入 脉冲 ， 输 入 总 线 值 都 存储 在 地 字 ”位 字 触发 器 。” 基 他 门 的 总 数 

址 字 中 。 4 6 24 82 

右边 的 表格 展示 了 实现 这 样 的 内 存 所 需 的 门 的 8 8 64 208 
数量 与 这 些 参 数 的 关系 。 需 要 设计 计算 机 电路 的 每 26 16 4096 be. 
个 人 都 能 很 快意 识 到 ， 每 个 内 存 位 能 否 被 高 效 而 紧 ” ? ”2 大 约 700 亿 
凑 地 实现 是 整个 电路 设计 中 非常 重要 的 。 OR 

时 钟 ” 我 们 最 后 一 个 时 序 电路 的 例子 是 时 钟 (clock)， 它 是 计算 机 中 一 个 重要 组 成 部 分 。 
“时 钟 节拍 ”(ticking clock) 是 一 个 基本 的 抽象 ， 它 将 计算 电路 中 发 生 的 所 有 事情 同步 化 。 我 
们 的 电路 是 这 个 抽象 的 硬件 实现 。 时 钟 的 主要 目的 是 驱动 取 指 - 执行 周期 ， 这 个 周期 的 细节 
我 们 在 第 一 次 介绍 TOY 时 已 描述 过 。 事 实 上 ， 我们 的 计算 电路 中 发 生 的 一 切 都 是 通过 响应 
时 钟 而 得 到 同步 的 。 
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位 位 置 0 ”位 位 置 ! ”位 位 置 2 ”位 位 置 3” 位 位 置 4 ”位 位 置 5 


1 二 


内 存 字 00 


ES 二 上 = 划 内 存 字 01 
间 。 + 
a :2 






内 存 字 10 


内 存 字 11 


出 线 
一 个 内 存 ( 4 个 六 位 宽 的 字 )， 写 入 脉冲 的 开关 级 分 析 
时 钟 滴答 (tick-tock)。 我 们 的 时 钟 的 计时 方法 是 基于 下 图 这 样 的 周期 性 脉冲 实现 的 。 


这 种 脉冲 信号 被 称 为 时 钟 信号 (clock signal)。 它 通常 是 0, 但 是 它 按照 固定 的 周期 迅 
速 地 切换 到 1。 我 们 通常 把 信号 是 1 的 时 间 当 作 一 个 脉冲 (pulse), 或 者 ， 为 了 表述 得 更 加 直 
观 ， 我 们 称 作 一 个 滴答 (tick)。 在 一 台 真 实 的 计算 机 中 ， 时 钟 信号 的 精度 是 最 重要 的 ,计算 
机 设计 师 竭尽 全 力 创造 可 靠 、 快 速 的 时 钟 。 如 今 ， 计 算 机 的 时 钟 可 能 会 每 秒 触发 数 十 亿 次 。 

在 我 们 的 计算 机 设计 中 ， 假 设 有 一 个 外 部 的 信和 号 源 可 以 产生 一 个 如 上 图 所 示 的 周期 性 信 
号 ， 除 了 这 一 基本 假设 外 ， 为 了 处 理 现 实 世界 中 的 问题 ， 我 们 再 做 两 个 额外 的 假设 : 

。 脉冲 长 到 可 以 激活 任何 开关 。 

。 从 一 个 脉冲 开始 到 下 一 个 脉冲 开始 的 时 间 长 于 电路 内 最 长 的 开关 激活 链 。 

第 二 个 参数 被 称 为 时 钟 速度 〈clock speed)， 这 是 一 个 相当 关键 的 参数 ， 如 它 决定 了 每 秒 
执行 的 指令 的 数量 ,精确 的 数值 不 是 很 容易 计算 ( 见 练习 7.4.14 )。 事 实 上 ,设计 现实 世界 
中 的 计算 机 的 一 个 常用 策略 是 利用 经 验 确 定 速度 : 从 一 个 保守 的 长 时 间 间 隔 开始 ， 不 断 地 给 
时 钟 加 速 ， 直 到 时 间 不 足以 激活 所 有 开关 而 导致 电路 中 断 ， 然 后 将 时 钟 时 间 设 置 得 相对 慢 
一 点 。 

通常 情况 下 ， 计 算 机 时 钟 采 用 不 同 于 构建 开关 的 技术 来 构建 ， 以 尽 可 能 实现 更 快 的 时 钟 
速度 。 通 常 ， 该 技术 涉及 在 物理 材料 内 激发 电气 振荡 。 与 开关 一 样 ， 与 
物理 世界 的 精确 连接 超出 了 本 书 的 范围 ， 与 我 们 正在 考虑 的 计算 机 设计 
的 逻辑 方面 无 关 。 

为 了 解决 这 个 问题 ， 你 可 以 想象 一 下 ， 在 一 个 表盘 上 的 接触 点 可 以 
使 得 秒针 每 隔 一 分 钟 产 生 一 个 一 秒 钟 的 信号 ， 如 右 图 所 示 。 这 样 的 设备 
可 以 产生 我 们 想 要 的 时 钟 信号 。 在 现实 世界 中 计算 机 的 时 钟 可 能 要 快 数 
十 亿 倍 ， 但 在 概念 上 是 一 样 的 。 如 果 选 择 一 个 合适 的 缩放 比例 ， 两 者 生 时 钟 
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成 的 时 钟 信号 看 起 来 可 能 也 是 相同 的 。 
取 指 和 执行 输出 。 时 钟 最 重要 的 目的 是 产生 周期 性 的 控制 信号 ， 我 们 可 以 用 它 来 区 分 获 
取 指 令 阶段 和 执行 指令 阶段 。 特 别 是 ， 我 们 想 要 有 这 样 的 信号 : 


取 指 





执行 


这 两 个 信号 是 相反 的 ， 所 以 如 果 我 们 产生 一 个 信号 来 获取 指令 ， 我 们 可 以 把 它 连 接 到 一 
个 非 门 来 得 到 一 个 执行 指令 ， 反 之 亦 然 。 有 很 多 方法 可 以 获得 这 样 的 信号 ， 也 许 最 简单 的 就 
是 将 一 个 时 钟 连接 到 一 个 寄存 器 位 ， 如 左 图 所 示 。 时 钟 控制 线 
连接 到 内 存 位 的 写 入 控制 线 ， 内 存 位 的 输入 值 是 存储 值 取 反 。 
通过 这 些 连 接 ， 每 个 时 钟 脉冲 都 会 使 触发 器 对 存储 值 进行 取 反 
运算 ， 直 到 下 一 个 时 钟 脉 冲 。 我 们 使 用 内 存 位 的 值 作为 我 们 执 
行 指 令 的 信号 以 及 将 它 的 取 反 结果 作为 我 们 取 指 令 的 信号 。 触 
发 器 记 住 时 钟 的 状态 ， 直 到 下 一 个 脉冲 ， 其 值 从 0 变 为 1 或 从 1 
变 为 0。 
写 控制 输出 。 在 计算 周期 的 获取 指令 和 执行 指令 阶段 ， 我 
们 需要 将 值 写 人 人 寄存器。 我 们 会 简短 地 分 析 这 些 具体 细节 ,但 
1059| 是 这 个 基本 的 实现 需要 我 们 在 时 钟 上 增加 两 个 门 电路 。 具 体 而 
言 ， 我 们 希望 再 增加 两 个 控制 输出 : 取 指 写 操 作 脉 冲 和 执行 写 
操作 脉冲 ,我们 希望 这 些 信 号 为 0， 直 到 它们 各 自 对 应 的 阶段 结 
束 时 输出 为 1。 为 了 解决 这 个 问题 我 们 可 以 通过 为 每 个 阶段 添加 





取 指 : 执行 
一 个 与 门 来 实现 。 时 钟 脉冲 与 取 指 信和 号 进行 “与 ”操作 得 到 取 到 指 执行 时 名 
指 写 操作 脉冲 ， 同 理 ， 时 钟 脉冲 与 执行 信号 进行 “与 ”操作 得 
到 执行 写 操作 脉冲 。 


运行 和 停机 输入 。 我 们 的 时 钟 电路 需要 两 个 其 他 输入 控制 线 ， 用 来 启动 和 停止 时 钟 。 运 
行 (run) 输入 用 来 启动 时 钟 一 一 可 以 想象 ， 它 连接 到 计算 机 控制 台 上 的 “运行 ”按钮 。 停 机 
(halt) 输入 用 来 停止 时 钟 一 一 当 程 序 执行 停机 指令 时 ， 该 输入 被 置 为 有 效 。 

下 图 展现 的 是 一 个 时 钟 电路 ， 同 时 也 考虑 了 刚才 讨论 的 问题 。 我 们 计算 电路 中 的 所 有 控 
制 线 最 终 由 四 个 时 钟 输出 之 一 驱动 。 时 钟 电路 控制 输出 会 不 断 地 进行 如 下 循环 : 

。 取 指令 为 1， 执 行 指令 为 0。 

。 取 指 写 操作 变 为 1。 

。 执行 指令 变 为 1， 取 指令 变 为 0。 

。 执行 写 操作 变 为 0。 

正如 你 将 在 下 一 节 中 看 到 的 ， 这 个 序列 可 以 在 计算 电路 中 实现 取 指 - 执行 循环 ， 从 而 可 
以 根据 计算 机 的 体系 结构 精确 地 改变 寄存 器 和 内 存 的 状态 。 

时 钟 与 我 们 对 时 序 电路 模块 的 研究 非常 接近 ， 因 为 它 充分 说 明了 我 们 利用 一 个 简单 的 电 
路 和 几 个 门 来 解决 复杂 行为 的 能 力 。 同 时 ， 它 还 说 明了 对 电路 反馈 进行 严格 控制 的 必要 性 ， 

因为 任何 反馈 都 会 导致 不 可 预知 的 行为 。 而 计算 的 本 质 是 完全 可 预测 性 ! 
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接口 电路 
冯 行 停机 运行 停机 


时 钟 


ro 
取 指 取 指 写 执行 执行 写 取 指 取 指 写 执行 ”执行 写 








执行 写 | | | 


具有 写 入 脉冲 的 取 指 - 执行 时 钟 


总 结 ”就 组 合 电路 而 言 ， 只 要 知道 输入 总 线 、 输 出 总 线 和 控制 线 的 尺寸 以 及 位 置 ， 我 们 
就 可 以 从 更 高 的 抽象 层次 上 结合 我 们 之 前 已 经 定义 的 模块 来 构建 电路 。 这 个 过 程 再 一 次 证 明 
了 抽象 的 力量 : 你 不 需要 知道 内 部 细节 就 可 以 完成 电路 的 设计 。 

对 于 寄存 器 ， 只 需要 知道 寄存 器 的 内 容 总 是 在 输出 总 线 上 可 用 ,并且 在 写 和 控制 信号 有 
效 时 ， 可 将 输入 总 线 上 的 值 存 储 到 寄存 器 中 。 

同样 ， 对 于 内 存 ， 你 只 需要 知道 地 址 字 的 内 容 总 是 在 输出 总 线 上 可 用 ， 并 且 写 人 控制 信 
号 的 启动 可 将 输入 总 线 上 的 值 存储 到 地 址 字 中 。 

对 于 时 钟 ， 你 只 需要 知道 它 可 以 产生 我 们 已 经 讨论 过 的 4 个 信号 ， 无 休止 地 重复 驱动 计 
算 机 的 取 指 - 执行 周期 的 信号 序列 。 

我 们 在 计算 设备 中 使 用 的 时 序 电路 模块 如 下 图 所 示 : 一 个 4 位 寄存 器 、 两 个 8 位 寄存 
器 、 一 个 16 个 8 位 字 的 内 存 和 一 个 时 钟 。 接 下 来 ， 我 们 将 研究 如 何 将 这 些 模块 与 上 一 节 中 
的 组 合 电路 模块 连接 在 一 起 〈 并 添加 少量 的 门 电路 ) 来 制作 计算 设备 。 
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时 序 电路 模块 接口 


问答 环节 


问 : 我 对 内 存 位 值 的 读 取 机 制 还 是 不 太 明 白 ， 
是 否 可 以 提供 更 多 细节 呢 ? 

答 : 下 图 展示 了 详细 的 电路 分 析 。 结 合 多 路 
复 用 器 的 概念 或 许 更 容易 理解 。 如 果 你 在 之 前 的 
章节 中 已 经 了 解 解码 器 与 多 路 复 用 器 之 间 的 区 别 ， 
你 就 能 看 到 在 内 存 电路 上 的 解码 器 、 内 存 位 的 与 
门 ， 以 及 每 位 的 垂直 或 门 ， 共 同 组 成 了 一 个 多 路 
复 用 器 。 
问 : 我 有 些 不 太 明白 时 序 图 ， 这 个 很 重要 吗 ? 

答 :一 方面 ,， 既然 时 序 (timing) 是 一 个 
重要 概念 并 在 现实 技术 中 有 不 同 的 表现 方式 ， 
那么 我 们 就 需要 认真 学 习 并 严谨 对 待 。 另 一 方 
面 ， 重 复 阅 读 我 们 如 何 设置 一 个 寄存 器 位 的 值 
(要 确保 我 们 理解 写 人 控制 线 的 操作 )， 以 及 如 
何 设置 时 钟 电路 (要 确保 我 们 理解 它 实现 的 控 


制 线 序列 )， 这 是 值得 花费 时 间 的 。 幸 运 的 是 ， 


我 们 不 需要 比 这 些 更 复杂 的 概念 一 一 从 现在 开 
始 ， 我 们 可 以 只 需要 在 模块 级 别 分 析 并 构建 计 





算 机 。 





值 为 0 


3 ee 选 通 线 均 为 0 





不 影响 电路 状态 触发 器 值 为 =-0 





读 取 一 个 内 存 位 
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练习 


7.4.1 利用 一 对 交叉 耦合 的 或 非 门 设计 一 个 触发 器 。 
答案 : (使 用 的 材料 稍 多 于 正文 中 的 解决 方案 )。 


输出 输出 
7.4.2，” 描 述 以 下 电路 实现 什么 ? 它 是 否 稳 定 ? 





7.4.3 ”描述 以 下 电路 的 行为 。 


时 钟 一 一 一 


REG 
BIT 


输出 
答案 : 输出 在 0 和 1 之 间 交 替 ， 每 一 次 时 钟 脉冲 变化 一 次 。 
7.4.4 ”设计 一 个 使 用 了 三 个 开关 的 蜂 鸣 器 (一 种 不 稳定 反馈 的 电路 )。 
7.4.5 使 用 8 个 内 存 位 和 一 个 解码 器 / 多 路 分 配器 ,设计 一 个 具有 4 个 内 存 字 、 每 个 字 2 位 的 内 存 。 
7.4.6 使 用 8 个 内 存 位 和 一 个 解码 器 /多 路 分 配器 ， 设 计 一 个 具有 2 个 内 存 字 、 每 个 字 4 位 的 内 存 。 
7.4.7 为 具有 2" 个 n 位 内 存 字 的 内 存 中 门 的 数量 设计 一 个 公式 ,使 用 这 一 公式 验证 正文 中 “不 同 规格 
的 内 存 中 门 的 数量 ”表格 。 


创新 练习 


7.4.8 ”电路 分 析 。 说 明 以 下 每 个 电路 使 用 的 开关 数量 。 
a. 一 个 寄存 器 位 
b. 一 个 内 存 位 
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7.4.9 


7.4.10 


7.4.11 


7.4.12 


7.4.13 


7.4.14 


7.4.]15 


7.4.16 


7.4.17 


7.4.18 


荔 7 草 


c. 一 个 8 位 寄存 器 

d.16 个 8 位 内 存 

e. 一 个 时 钟 电路 

计数 每 个 开关 (比如 ， 一 个 2 路 与 门 有 4 个 开关 )。 

设计 一 个 寄存 器 。 编 写 一 个 Java 程序 来 实现 一 个 n 位 寄存 器 ， 从 命令 行 中 读 取 一 个 整数 作为 参 
数 n。 

设计 一 个 寄存 器 ( 接 上 题 )。 在 上 一 个 练习 编写 的 程序 基础 上 继续 修改 ， 使 程序 读 取 第 二 个 命 
令 行 参数 x， 并 使 得 设计 出 的 寄存 器 中 存储 x 的 二 进 制 形式 ( 写 人 信号 为 1 )。 若 有 第 三 个 命令 
行 ?， 设 计 一 个 寄存 器 使 其 写 入 信号 为 0， 并 且 其 输入 线 上 的 数据 为 ?的 二 进 制 形式 。 

设计 一 个 内 存 。 编 写 一 个 Java 程序 ， 从 命令 行 中 读 取 整数 m 和 nn， 实 现 一 个 具有 2” 个 nn 位 内 
存 字 的 内 存 。 

设计 一 个 内 存 ( 接 上 题 )。 从 标准 输入 中 读 取 2” 个 整数 ， 在 上 一 个 练习 题 编写 的 程序 的 基础 
上 ， 实 现 一 个 存储 这 些 整数 的 内 存 ， 然 后 添加 功能 ， 以 实现 新 值 写 入 内 存 的 过 程 。 

双 端 口内 存 。 设 计 一 个 内 存 模块 ， 具 有 2 个 输出 总 线 、2 个 地 址 线 、2 个 读 取 控制 线 ， 在 输出 
总 线 上 可 以 输出 2 个 内 存 字 的 内 容 。 

时 序 。 当 写 入 脉冲 输出 到 一 个 2 个 地 位 内 存 字 的 内 存 上 时 ， 给 出 被 激活 的 开关 链条 的 最 大 
长 度 。 

时 钟 。 描 述 如 何 建立 一 个 时 钟 电路 ( m, n)， 电 路 详细 说 明 如 下 : 假设 所 有 开关 操作 均 需 要 一 
个 固定 时 间 x 秒 ， 当 导线 连接 到 电源 时 ， 导 线 上 所 有 的 值 瞬时 变 为 1。 一 个 (m, n) 时 钟 电路 在 
mx 秒 内 生成 信号 0， 在 nx 秒 内 生成 信号 1， 并 以 〈m + n) x 秒 为 一 个 周期 ， 在 两 个 输出 值 之 
间 不 断 转 换 。 

二 进 制 计 数 器 。 描 述 如 下 电路 在 输入 线 上 产生 一 系列 时 钟 脉冲 时 的 行为 。 


时 钟 





Zo 


1 2 2 


答案 : 这 是 一 个 计数 器 ( counter)。 如 果 将 z3z2z1zo 看 作 一 个 二 进 制 值 ， 那 么 每 个 时 钟 脉冲 后 这 
个 值 会 增 1。 在 练习 7.4.3 的 基础 上 理解 这 个 电路 。 

循环 计数 器 。 用 重 置 (reset)、 写 入 (write) 控制 输入 ， 以 及 输出 2 一 2 作为 6 个 寄存 器 位 来 设 
计 一 个 电路 ， 该 电路 可 以 满足 : reset 将 信号 z 设置 为 1， 其 他 触发 器 设置 为 0， 写 和 人 脉冲 的 值 
依次 在 : 100000, 010000, 001000, 000100, 000010, 000001, 100000，… 之 间 循 环 。 

LFSR。 设 计 一 个 电路 来 实现 线性 反馈 移 位 寄存 器 (LFSR)， 如 练习 7.4.15 中 所 示 。 用 12 个 寄 
存 器 位 来 构建 电路 ， 从 右 到 左 依次 标记 为 0 一 11 ， 以 位 0 作为 输出 ， 输 入 来 自 输 入 总 线 。 将 一 
个 时 钟 信号 作为 控制 输入 。 每 次 时 钟 脉 冲 开 始 ， 用 位 11 的 值 和 位 9 的 值 进 行 异 或 运算 后 送 到 
位 0 中 ,将 其 余 各 位 的 值 依 次 向 左 移动 一 位 ， 而 位 11 的 值 忽略 。 这 个 设备 可 以 加 载 一 个 11 位 
的 数据 作为 种 子 ， 并 在 每 次 时 钟 滴答 后 产生 一 个 “随机 ”位 。 
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作为 最 后 一 节 ， 本 节 主 要 解决 的 问题 是 ， 连 接 和 控制 我 们 在 前 两 节 中 所 讨论 的 电路 
模块 。 

第 一 个 要 处 理 的 是 计算 部 分 ， 第 二 个 是 存储 部 分 ， 第 三 个 是 控制 部 分 ( control) 。ALU、 
总 线 复 用 器 、 寄 存 器 和 存储 器 占 CPU 门 电路 总 数 的 99% 以 上 ， 从 某 种 意义 上 来 说 ， 我 们 已 
经 基本 完成 了 。 但 从 另 一 个 角度 来 说 ， 我 们 刚刚 开始 能 够 解决 “计算 机 如 何 运 行 ”的 问题 ， 
因为 剩余 的 门 电 路 将 解决 的 是 控制 信息 如 何以 及 何 时 传 给 处 理 器 。 它 们 解决 的 是 计算 机 核心 
的 问题 ， 即 “执行 程序 ”的 问题 。 

TOY-8 首先， 我们 明确 一 下 我 们 的 目标 : 为 我 们 的 TOY 系列 最 小 的 虚拟 计算 机 设计 
一 个 CPU。 我 们 之 前 已 经 提 及 了 关于 TOY-8 的 许多 信息 ， 现 在 我 们 将 细 化 这 些 问题 。 

基础 参数 。 我 们 真正 的 目标 是 易于 讲解 : 我 们 想 在 本 书 的 两 页 纸 上 展 示 一 个 完整 计算 机 
的 电路 实现 ， 可 以 看 到 每 个 开关 。 因 为 TOY-8 是 一 个 非常 小 的 计算 机 ， 只 有 16 个 8 位 字 的 
存储 器 和 一 个 寄存 器 。 尽 管 有 这 些 或 多 或 少 的 限制 ， 但 用 TOY-8 完成 非常 重要 的 计算 任务 
也 不 是 不 可 能 的 (但 我 们 不 会 花 时 间 这 样 做 )。 

指令 系统 。 由 于 只 有 一 个 寄存 器 ,，TOY-8 的 指令 格式 与 TOY 格式 有 很 大 不 同 。 具 体 
而 


了 


。 每 条 指令 都 隐 含 地 指向 唯一 的 寄存 器 ， 所 以 指令 不 需要 特别 地 指向 寄存 器 。 
。 为 了 指定 一 个 内 存 字 的 地 址 ， 我 们 需要 4 位 二 进 制 数 。 

。 为 了 指定 一 个 操作 码 ， 我 们 需要 3 位 三 进 制 数 。 

。 位 0 未 被 使 用 (一 直 保持 为 0 )。 

TOY-8 指令 的 格式 如 下 图 所 示 。 


操作 码 (3 位 ) 地 址 (4 位 ) 
/ 
[Ce Jol sur ] 
TOY-8 指令 解析 
这 些 规定 体现 了 指令 集体 系 结构 中 涉及 的 因素 ,这 是 早期 计算 机 设计 中 相当 重要 的 一 个 [1070] 
因素 。 例 如 ， 我 们 可 能 并 没有 确定 在 计算 机 的 下 一 个 版 本 中 是 否 要 支持 16 条 指令 或 32 个 字 
的 内 存 。 现 在 你 可 能 会 明白 早期 的 设计 师 为 什么 留 下 一 些 未 使 用 的 位 ， 这 样 可 以 在 后 续 修 改 
时 保持 一 些 灵 活性 。 我 们 这 里 的 设计 目 


标 是 尽 可 能 简单 地 开发 一 台 能 够 说 明 真 ” 扒 作 中 "描述 伪 代 码 

实 计算 机 主要 特性 的 计算 机 ， 所 以 我 们 00 0 全 

认为 8 个 指令 和 16 个 字 的 内 存 足 以 满足 0010 2 加 法 R= R+ Mladdr] 

我 们 的 需要 。 0100 4 按 位 与 R = R & MLaddr] 
完整 的 TOY-8 指 令 集 在 右 表 中 给 0110 6 按 位 异 或 R = RA M[addr] 

出 。 它 缺少 在 TOY 指 令 集 中 的 减法 1000 8 加 载 地 址 = addr 

(subtract)、 移 位 、 间 接 寻 址 , 以 及 在 TOY 1010 A 加 载 R = M[addr] 

指令 集 里 的 三 种 不 同 的 分 支 / 跳 转 指令 ， 1100 C 存储 M[addr] = R 

但 它 还 是 实现 了 算术 、 条 件 和 循环 ， 能够 “1110 上 为 0 则 距 转 “if (R == 0) PC = addr 


满足 计算 的 基础 需要 。 TOY-8 指令 集 
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由 于 未 使 用 的 位 始终 为 0， 因此 我 们 使 用 两 个 十 六 进 制 数 来 描述 指令 时 ， 操 作 码 总 是 偶 
数 。 例 如 ; 指令 2E 是 “将 寄存 器 R 的 内 容 加 上 存储 单元 E 的 内 容 再 赋 给 R 寄存 器 ”， 指 令 
CE 是 “将 R 的 内 容 存储 到 存储 单元 E” 

与 TOY 一 样 ,假设 存储 单元 F 连接 到 标准 输入 / 输出。 我 们 还 假设 内 存 地 址 0 始终 存储 0。 

TOY-8 的 程序 。 举 例 来 说 ， 以 下 是 利用 TOY-8 指令 实现 的 程序 6.3.3, 对 输入 的 数 进行 求 和 : 


RAO0 Rs 

2 CE M[E]-= R int sum = 0 

3 AF R= stdin while (!StdIn.isEmpty()) 
4 E9 if (R == 0) PC=9 { 

5 2E R= R+ MIEI c= StdIn.readInt() 
6° CE M[E] = R if (c == 0) break 
7 AOxTR0 sum = Sum + C 

8 E3 if (R== 0) PC = 3 } 

9 AE R = M[E] 

A CF stdout =R StdOut.printin(sum) 

B 00 halt 


请 注意 ， 寄 存 器 (R) 的 使 用 率 极 高 。 例 如 ， 为 了 做 一 个 无 条 件 的 跳 转 ， 我 们 需要 首先 
将 0 加载 到 R 中 ,然后 再 执行 branch 指令 跳 转 到 地 址 0。 编 写 这 种 代码 的 经 验 恰 恰 是 早期 
计算 机 设计 者 决定 设置 多 个 寄存 器 的 原因 。 决 定 采用 32 个 字 的 存储 还 是 16 个 指令 ， 确 实 很 
难 。 当 然 ， 从 设计 的 角度 来 看 ， 增 加 更 多 的 内 存 是 很 容易 的 ， 但 事实 上 每 扩展 一 位 的 存储 也 
势必 面临 着 成 本 增加 的 挑战 。 同 样 ， 增 加 更 多 的 指令 需要 额外 的 电路 设计 ， 也 是 一 个 挑战 。 

所 有 这 些 细节 都 比较 重要 ， 因 为 我 们 目前 的 重点 并 不 是 使 用 TOY-8 编程 ， 而 是 开发 一 
个 实现 TOY-8 的 电路 。 这 个 讨论 之 所 以 有 价值 ， 是 因为 TOY-8 与 TOY 和 真 机 相似 ， 除 了 
规模 之 外 。 通 过 我 们 增加 更 多 的 内 存 或 者 更 多 的 指令 ,我 们 可 以 用 TOY-8 这 样 的 机 器 来 实 
现 前 面 章节 中 所 有 的 程序 ， 而 这 会 使 我 们 置身 于 一 个 TOY 的 计算 世界 ， 许 多 基本 特性 就 像 
现在 真实 的 计算 机 上 的 一 样 。 

我 们 不 考虑 计算 机 的 物理 特性 ， 如 键盘 、 显 示 屏 、 电 池 、 电 源 连接 等 ， 我 们 的 兴趣 在 
于 计算 电路 的 设计 一 一 CPU。 打 开 计 算 机 的 电路 板 ， 你 会 发 现 一 个 包含 这 个 电路 的 黑色 方形 
“芯片 ” 。 接 下 来 ,我 们 来 了 解 这 个 芯片 内 部 的 问题 。 
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热身 ”作为 设计 一 个 完整 计算 机 的 热身 运动 ， 我 们 先 从 计算 机 数字 设备 的 核心 开始 : 程 
序 计 数 器 《PC)。 回 想 第 6 章 ， 程 序 计数 器 的 目的 是 跟踪 当前 正在 执行 的 指令 的 地 址 。 其 值 
可 以 通过 以 下 两 种 方式 之 一 进行 更 改 : 或 者 自 增 (大 部 分 时 间 ), 或 者 赋 给 一 个 全 新 的 值 (对 
于 分 支 条 件 )。 

程序 计数 器 说 明了 我 们 在 实现 数字 设备 时 需要 考虑 的 重要 因素 。 具 体 而 言 ， 我 们 需要 解 
决 以 下 问题 ， 

。 我 们 需要 哪些 模块 ? 

。 信息 如 何 从 一 个 模块 传播 到 另 一 个 模块 ? 

。 控制 线路 有 哪些 ?控制 信号 的 时 序 如 何 ? 

在 构建 寄存 器 和 内 存 模块 时 ， 我 们 已 经 考虑 了 这 些 问 题 。 现 在 ， 我 们 面 对 的 是 一 个 更 为 
复杂 的 数字 设备 一 一 PC， 因 此 需要 再 一 次 综合 考虑 以 上 问题 。 后 文 的 图 展示 了 最 终结 果 。 

接口 。PC 的 主要 功能 是 保存 当前 指令 的 地 址 ， 所 
以 我 们 期 望 地 址 始终 在 输出 总 线 上 可 用 。PC 的 值 可 以 
通过 两 种 方式 进行 更 改 : 或 者 递增 , 或 者 更 改 为 不 同 
的 值 (用 于 分 支 指 令 )。 因 此 ， 我 们 需要 两 个 控制 信号 
( 自 增 和 加 载 ) 和 一 个 跳 转 地 址 的 总 线 输 入 。 我 们 还 需 


PROGRAM COUNTER (PC) 


要 一 根 写 控制 线 来 控制 PC 值 的 在 何 时 被 修改 。 综 合 "个 二 
以 上 分 析 ， 得 出 如 右 图 所 示 接口 。 加 载 
模块 。 我 们 至 少 需要 两 个 模块 
。 一 个 寄存 器 来 保存 地 址 。 


。 一 个 增 量 器 ， 可 以 在 原来 地 址 的 基础 上 加 1。 

以 上 仅仅 是 构建 计算 机 数字 设备 的 开端 。 后 面 会 
看 到 ， 当 我 们 考虑 模块 交互 时 ， 还 会 需要 另 一 个 模块 。 PC 模块 接口 

总 线 连接 。 为 了 将 信息 从 一 个 模块 传输 到 另 一 
个 模块 ， 我 们 需要 用 导线 在 模块 间 建 立 连接 。 大 多 数 情况 下 这 样 的 导线 都 是 总 线 连接 (bus 
connection) 的 一 部 分 ， 通 常 将 一 个 模块 的 输出 总 线 连 接 到 另 一 个 模块 的 输入 总 线 上 ， 每 一 位 
用 一 根 导线 连接 。 鉴 于 我 们 有 一 个 寄存 器 和 一 个 增 量 器 ， 我 们 至 少 需 要 以 下 四 条 总 线 连接 : 

。 PC 寄存 器 到 增 量 器 (要 自 增 的 数字 ， 即 当前 地 址 ) 

。 增 量 器 到 PC 寄存 器 〈 自 增 后 的 结果 ) 

。 PC 输入 到 PC 寄存 器 〈 新 值 ， 在 跳 转 时 使 用 ) 

。 PC 寄存 器 到 PC 输出 (用 于 取 指 令 ) 

以 上 描述 都 是 缩 略 的 写法 ， 因 为 我 们 的 总 线 连 接 总 是 将 一 个 模块 的 输出 总 线 连接 到 另 一 
个 模块 的 输入 总 线 。 因 此 ,“ PC 寄存 器 到 增 量 器 ”实际 上 的 意思 是 “PC 寄存 器 输出 总 线 到 
增 量 输入 总 线 ”。 

从 这 个 列表 中 我 们 可 以 看 到 PC 寄存 器 有 两 个 输入 和 两 个 输出 ， 但 是 输入 和 输出 之 间 存 
在 不 对 称 。 我 们 可 以 拆 分 一 个 模块 的 输出 来 连接 两 个 不 同 的 输入 ， 只 需要 个 形 连接 一 一 拆 分 
之 后 两 个 总 线 之 间 的 值 完 全 相同 。 但 是 我 们 不 能 将 来 自 两 个 不 同 模块 的 输出 结合 到 一 个 模块 
的 输入 端 ， 因 为 这 些 线 可 能 会 有 不 同 的 值 一 一 我 们 必须 使 用 一 个 开关 来 隔离 它们 (通常 是 总 
线 多 路 复 用 器 )。 相 应 地 ， 我 们 添加 一 个 2 路 的 总 线 复 用 器 ， 用 来 代替 前 面 列 出 的 第 二 个 和 
第 三 个 总 线 连接 : 
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626 常 了 站 


。 增 量 器 到 总 线 复 用 器 0。 

。 PC 输入 到 总 线 复 用 器 1。 

。 总 线 复 用 器 到 PC 寄存 器 。 

综合 上 述 设计 ， 得 到 的 线路 图 如 右 图 所 示 。 
为 了 清楚 起 见 ， 我 们 遵从 输出 总 线 从 模块 右 下 
方 输出 ,输入 总 线 从 左上 角 输 入 的 惯例 。 有 时 
候 ， 从 模块 的 同一 侧 连 接 可 以 使 得 导线 的 路 径 ”输入 二 
更 短 ， 但 是 这 样 会 难以 区 分 输入 和 输出 ， 并 且 ” 增 量 
有 时 需要 翻转 扭曲 总 线 来 保证 位 的 顺序 。 

控制 线 。 控 制 线 直接 与 我 们 使 用 的 模块 相连 
接 ， 并 精确 对 应 于 我 们 设计 的 接口 上 的 控制 线 : 

。 控制 总 线 多 路 复 用 器 的 是 两 根 线 ( 自 增 





和 加 载 )， 以 允许 我 们 选择 PC 是 自 增 还 人 全 村 入 出 
。 写 入 控 制 线 用 于 控制 寄存 器 从 总 线 上 加 
载 数据 的 过 程 。 


与 其 他 总 线 多 路 复 用 器 一 样 ， 我 们 不 会 将 自 增 和 加 载 控 制 信号 同时 设置 为 1。 与 存储 器 
电路 一 样 ， 在 写 入 脉冲 到 来 之 前 不 会 进行 任何 操作 。 如 果 此 时 自 增 为 1 ( 且 加 载 为 0)， 则 寄 
存 器 进行 自 增 ; 如 果 此 时 加 载 为 1 ( 且 自 增 为 0)， 则 PC 输入 总 线 上 的 值 将 加 载 到 寄存 器 中 。 

请 注意 ， 此 电路 的 总 线 连接 有 很 长 的 周期 。 当 自 增 信号 为 时 ， 如 果 此 时 没有 写 六 控制 
线 ， 电 路 将 无 限 循环 ， 增 加 PC。 若 有 写 入 控制 线 ， 我 们 可 以 确保 PC 与 其 他 模块 进行 同步 
改变 。 我 们 在 计算 机 电路 设计 的 过 程 中 会 反复 用 到 这 一 机 制 。 

连接 和 时 序 。PC (甚至 任何 数字 设备 ) 的 行为 完全 取决 于 得 到 的 控制 信号 和 输入 数据 ， 
以 及 它们 到 来 的 顺序 ， 而 这 些 都 来 自 于 其 他 模块 的 连接 。 我 们 的 计算 机 有 四 个 这 样 的 连接 : 
输入 总 线 、 自 增 控制 线 、 加 载 控制 线 和 写 人 控制 线 。 

。 输 入 总 线 的 值 由 IR 中 的 地 址 位 决定 的 〈 当 正在 执行 的 指令 是 跳 转 时 ) 。 

。 自 增 或 者 加 载 控制 值 (只 能 是 三 者 中 的 一 个 ) 由 在 执行 阶段 的 时 钟 周 期 内 决定 的 ， 取 

决 于 当前 指令 是 否 为 跳 转 。 如 果 当 前 指令 是 跳 转 且 R 为 0 则 为 加 载 ， 否 则 就 是 自 增 。 

。 写 和 人 控制 取决 于 来 自 时 钟 周 期 的 执行 写 人 信号 ， 这 将 导致 新 值 存储 到 PC 寄存 器 中 。 

通过 这 些 连接 ,来 自 时 钟 的 信号 周期 决定 了 电路 的 行为 : 不 管 是 增 量 值 还 是 跳 转 地 址 都 
会 在 执行 周期 结束 时 加 载 进 PC 寄存 器 。PC 的 内 容 总 是 在 输出 总 线 上 可 用 (但 是 它 只 在 取 指 
阶段 使 用 ， 提 供 下 一 条 取 指 令 的 地 址 )。 

总 之 , 我们 的 PC 有 3 个 模块 、3 根 内 部 总 线 连接 、1 根 输入 总 线 和 1 根 输出 总 线 ， 以 
及 3 个 控制 输入 。 这 对 我 们 整体 理解 CPU 会 是 一 个 很 好 的 热身 ， 因 为 它 有 助 于 理解 取 指 - 
执行 周期 中 时 钟 信号 的 作用 ， 以 及 写 使 能 信号 在 控制 和 同步 内 存 位 状态 变化 中 的 作用 。 如 果 
你 了 解 PC 的 工作 原理 ， 那 么 你 也 将 会 很 容易 理解 CPU 的 工作 原理 。 

如 同 之 前 的 思路 ， 现 在 我 们 可 以 在 更 高 的 抽象 层面 应 用 PC 电路 。 因 此 ， 在 后 续 的 设计 
中 ， 我 们 会 保留 原来 的 接口 ， 并 且 知 道 只 要 提供 了 相应 的 控制 信号 ，PC 相应 的 控制 值 将 做 
出 相应 的 改变 。 

TOY-8 CPU 的 组 织 和 连接 最 后 ， 我 们 准备 实现 本 章 的 目标 : 设计 一 个 完整 的 CPU。 
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我 们 遵循 与 PC 相同 的 方法 ， 但 会 有 更 多 的 模块 、 总 线 连接 和 控制 线 。 值 得 注意 的 是 ， 实 际 
上 没有 那么 多 : PC 有 2 个 模块 、1 个 总 线 多 路 复 用 器 、5 根 总 线 连接 和 3 根 控制 线 ， 而 CPU 
只 有 7 个 模块 、2 个 总 线 多 路 复 用 器 、10 根 总 线 连接 和 16 根 控制 线 。 
接口 。 我 们 的 CPU 电路 直接 与 外 部 相连 ， 而 不 是 另 
i 一 个 内 部 的 电路 模块 。 例 如 ，TOY-8 面板 上 的 RUN 按钮 
用 于 启动 时 钟 ， 就 会 与 CPU 的 RUN 信和 号 相连 接 。 除 此 之 
外 ， 我 们 省 略 了 这 些 连 接 的 细节 : 连接 到 开关 、 按 钮 和 前 
面 面 板 上 的 指示 灯 的 线 ， 以 及 与 IO 设备 的 连接 。 为 了 构 
建 CPU， 我 们 可 以 假定 内 存 和 PC 保存 着 通过 硬件 提供 的 
初始 值 (程序 及 其 起 始 地 址 )。 现 在 ， 这 个 基本 功能 已 经 
CPU 接口 从 程序 员 利 用 开关 发 送 二 进 制 代码 发 展 到 在 时 钟 开 始 之 前 
利用 专用 的 硬件 来 初始 化 整个 存储 器 。 另 外 ， 从 CPU 的 
角度 来 看 ， 标 准 IO 设备 是 纸 带 读 取 器 / 打 孔 器 还 是 连接 到 互联 网 也 没有 区 别 ， 因 此 我 们 也 
不 需要 考虑 该 接口 的 细节 。 
模块 。 我 们 的 TOY-8 CPU 电路 由 七 个 模块 组 成 。 除 了 下 面 这 个 列表 中 的 最 后 一 项 以 外 ， 
所 有 这 些 都 很 熟悉 ， 因 为 自从 第 一 次 介绍 TOY 后 ,我 们 已 经 多 次 提 到 它们 。 
。ALU。 
。 处 理 器 寄存 器 (R)。 
。 指令 寄存 器 (IR)。 
。 程序 计数 器 (PC)。 
。 主 存 。 
。 取 指 -执行 时 钟 ( 写 人 脉冲 )。 
。 一 个 称 为 CONTROL 的 组 合 电 路 ， 用 于 管理 控制 线路 。 
本 章 前 半 部 分 未 介绍 到 CONTROL， 因 此 CONTROL 的 设计 和 实现 是 本 节 的 重点 。 
总 线 连 接 。 大 多 数 总 线 用 于 数据 的 传输 ， 它 们 由 TOY-8 中 的 8 条 线 组 成 ; 还 有 一 部 分 
用 于 地 址 位 的 传输 ， 它 们 由 3 根 导线 组 成 。 在 一 个 64 位 机 中 ， 总 线 的 宽度 是 设计 的 主要 考 
虑 因素 ， 为 了 传输 一 个 内 存 字 ， 总 线 需要 64 根 线 。 即 使 在 TOY-8 中 ， 你 也 会 看 到 总 线 设 计 
是 电路 的 一 个 重点 。 
机 器 内 的 总 线 连接 由 指令 集 的 需求 决定 。 例 如 ， 要 在 TOY-8 机 器 上 执行 存储 指令 ，IR 
的 地 址 位 必须 连接 到 存储 器 的 地 址 线 ， 而 尺 必须 连接 到 存储 器 的 输入 总 线 。 以 同样 的 道理 
分 析 TOY-8 中 的 所 有 总 线 连接 ， 如 以 下 表格 所 示 。 


指令 总 线 连接 指令 总 线 连接 
PC 到 内 存 的 地 址 线 地 址 加 载 IR 地 址 到 R 
所 有 指令 的 取 指 内 存 到 IR 
IR 地 址 到 内 存 地 址 
停机 无 加 载 内 存 到 R 
下 地 址 到 内 存 地 址 存储 下 地 址 到 内 存 地 址 
加 法 、 异 或 、 与 内 存 到 ALU0 R 到 内 存 
” R 到 ALU1 
人 [让 到 为 0 则 跳 转 IR 地 址 到 PC 


TOY-8 指令 的 总 线 连 接 
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正如 我 们 在 PC 上 看 到 的 ,我 们 不 能 有 两 条 不 同 的 输出 总 线 连接 到 同一 条 输入 总 线 上 ， 
所 以 这 个 连接 列表 意味 着 需要 两 个 总 线 多 路 复 用 器 : 一 个 3 路 总 线 多 路 复 用 器 用 于 输入 到 R 
的 转换 (ALU、IR 地 址 位 和 内 存 ) 以 及 一 个 2 路 总 线 多 路 复 用 器 ， 用 于 转换 内 存 的 输入 地 址 
总 线 (PC 和 下 地 址 )5 我 们 分 别称 之 为 “了 R 复 用 器 ”和 “MA 复 用 器 ”。 其 他 的 连接 都 是 从 
一 个 模块 的 输出 总 线 直接 连接 到 另 一 个 模块 的 输入 总 线 。 


CLOCK 信号 开始 
CLOCK 信号 停止 


后 面 表格 展示 了 模块 、 总 线 多 路 复 用 器 和 TOY-8 CPU 的 总 线 连接 (以 
及 稍 后 会 介绍 到 的 控制 线 )。 为 了 更 好 地 理解 总 线 连接 表 ， 请 仔细 看 参考 图 。 
控制 线 。 我 们 现在 的 任务 是 组 织 控制 我 们 的 模块 和 多 路 复 用 器 的 线 


ALU 执 行 加 法 
Ts 路 。 每 条 控制 线 都 是 模块 的 输入 ， 并 选择 执行 的 指令 。 正 如 左 表 所 示 。 所 
4LU 委 行 与 有 的 控制 线 由 时 钟 信 号 驱动 ， 所 以 每 个 控制 线 都 需要 连接 到 一 个 时 钟 信 
Rmio ALU 号 。 而 CONTROL 电路 的 功能 就 是 对 这 些 连接 进行 管理 ,我 们 将 在 本 节 
RmwMEMORY 后 面 介绍 。 在 这 之 前 ， 我 们 按照 不 同 的 指令 罗列 所 有 需要 的 控制 线 ， 每 四 
Pei 个 时 钟 信号 一 条 指令 ， 并 汇总 在 后 面 的 表格 中 。 接 下 来 ， 我 们 会 更 详细 地 
R 写 入 描述 。 
IR 写 入 取 指 令 。 首 先 ， 考虑 CPU 的 取 指 令 阶 段 ， 这 很 简单 ， 因 为 所 有 指令 的 
人 控制 信号 都 是 相同 的 。 取 指令 的 目的 是 按照 PC 中 的 地 址 将 指令 加 载 到 IR 
CX 中。 这 个 行动 分 两 步 完成 
MA mux PC 。 取 指令 时 钟 信号 将 地 址 多 路 复 用 器 (address mux) PC 控制 线 设 置 为 1。 
MA mux IR 。 取 指令 写 时 钟 脉冲 直接 连接 到 IR 写 入 。 
人 由 于 藤 唯一 的 总 线 输 入 是 来 自 内 存 的 输出 ， 所 以 这 个 时 钟 序列 将 导致 
OY8 控制 线 所 寻 址 的 字 (下 一 条 指令 ) 被 加 载 到 IR 中 。 
CLOCK 
ALU | | | 
奈 内 存 
16 个 字 
加 PC 8 位 / 字 
i CONTROL . 
国 FE 
R MUX EE F [ 
ADDR MUX 
R rt 
= 


TOY-8 CPU 的 布局 、 总 线 连接 和 控制 连 线 


执行 。 对 于 执行 阶段 ， 控 制 信号 序列 依赖 于 当前 的 指令 。 的 确 ， 每 个 控制 信号 序列 实现 
了 每 条 指令 的 功能 。 大 多 数 指令 为 RR 写 入 一 个 新 的 值 ， 所 以 对 于 store 指令 ， 执 行 写 入 时 钟 
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脉冲 驱动 内 存 进行 写 回 ; 对 于 算术 指令 、load 指令 、load addr 指令 ， 驱 动 R write 以 写 人 寄 
存 器 R。 在 其 他 情况 下 ， 控 制 信号 用 于 控制 总 线 复 用 器 的 开关 ， 或 者 用 于 为 ALU 选择 适当 的 
操作 。 

另外 ， 在 执行 阶段 ，PC 的 值 总 是 在 变化 ， 因 此 执行 写 入 时 钟 信号 连接 到 PC 写 入 控制 
线 。 对 于 除了 跳 转 指令 (branch if zero) 之 外 的 指令 ， 执 行 时 钟 信号 驱动 PC 会 自 增 ， 如 果 


执行 跳 转 指令 ， 则 执行 时 钟 将 跳 转 地 址 写 入 PC。 和 Ne 
为 了 更 好 地 理解 这 个 表格 ,我 们 会 仔细 讲解 每 条 让 指 iiecmapc 天 
指令 ， 并 依次 回答 以 下 问题 : 指令 的 功能 是 什么 ? 总 二 大 
线 如 何 连接 以 完成 其 目的 ? 哪 一 个 控制 信号 序列 可 以 区 
完成 这 项 工作 ? 我 们 依次 来 看 。 加 法 A R 
停机 。 停 机 指令 使 得 CLOCK 停止 控 制 线 变 高 ， 了 
丛 而 停止 时 钟 。 人 A IR 
算术 指令 。 随 着 总 线 连接 的 建立 ， 以 及 MA 多 路 异 或 ALUxor R 
复 用 碟 控 制 信号 变 为 高 电 平 ， ALU 会 计算 加 法 、 按 Re 
位 异 或 、 按 位 与 等 ， 操 作 数 分 别 为 IR 和 R 所 指向 的 3 i 
操作 数 ， 但 是 执行 时 ， 只 有 相应 控制 信号 为 1 的 结果 R mux (ALU) 


才 会 出 现在 ALU 的 输出 总 线 上 。 该 总 线 连接 到 R 的 加 载 地 址 i 

多 路 复 用 右 ， 因 此 在 执行 期 间 ， 当 R 写 入 脉冲 上 升 i 

时 ， 其 线 上 的 值 被 存储 在 R 中 。 加 载 R mux (memory) 
加 载 地 址 (load addr)。 在 执行 过 程 中 R 多 路 复 二 address mux (TR) ”内 存 

用 ALU 控制 线 变 为 高 电 平 ， 在 执行 写 人 期 间 ， 借 ”除了 earzao 

助 R 写 入 (R write) 信号 ， 将 来 自 IR 的 地 址 位 存 成 功 之 外 的 所 有 情况 


R 


PE 


储 在 R 中 。 成 的 情史 Po PC 
加 载 (load)。 在 执行 过 程 中 ，R 多 路 复 用 IR 控 TOY 8 结构 的 控制 线 


制 线 和 MA 多 路 复 用 IR 控制 线 的 高 电 平 到 来 ， 在 执 
行 写 人 期 间 的 R 写 入 (R write) 会 使 得 所 寻 址 的 内 存 字 被 存储 在 R 上 (由 于 存储 器 输出 总 
线 连接 到 R 的 多 路 复 用 器 )。 

存储 (store)。 在 执行 过 程 中 MA 多 路 复 用 IR 控制 线 变 为 高 电 平时 ， 在 执行 写 人 期间 
(由 于 RR 的 输出 总 线 连接 到 内 存 的 输入 总 线 )，R 写 人 (RR write) 会 使 得 所 寻 址 的 内 存 字 被 存 
储 在 R 上 。 

PC 自 增 。 在 执行 期 间 PC 自 增 控制 高 电 平时 ， 在 执行 写 人 期 间 由 增 量 器 计算 的 值 被 存储 在 
PC 中 ， 依 据 执 行 写 人 期 间 的 PC 写 人 ， 除 非 当 前 指令 是 转移 指令 (branch ifzero)， 且 RR 为 0。 

PC 加 载 。 如 果 当 前 指令 是 转移 指令 ， 且 了 也 为 0， 在 执行 过 程 中 PC 加 载 控 制 高 电 平 
时 ， 在 执行 写 入 期 间 ，PC 写 入 会 将 IR 地 址 线 中 的 值 存储 在 PC 中 。 

总 之 ， 每 条 指令 都 是 由 一 系列 控制 信号 来 实现 的 。 每 个 序列 由 时 钟 决 定 ， 以 响应 另 一 个 
组 合 电路 CONTROL ， 我 们 接 下 来 讨论 CONTROL 电路 的 实现 。 

CONTROL 电路 ”后 文 展示 了 将 时 钟 信 号 传递 给 控制 线 的 CONTROL 电路 的 设计 图 。 
值得 注意 的 是 ， 它 由 两 个 复 用 器 和 五 个 门 组 成 。 时 钟 电路 会 产生 一 个 无 限 循环 : 取 指 令 
( fetch)、 取 指 写 入 (fetch write)、 执 行 (execute)、 执 行 写 入 (execute write)， 它 们 出 现在 
电路 图 的 顶部 。 接 下 来 ,我 们 详细 讨论 对 这 些 时 钟 信号 序列 的 响应 。 当 然 ， 理 解 这 个 响应 


630 希 7 浊 


的 关键 是 要 认识 到 它 非 常 依赖 于 机 器 的 当前 状态 ， 特 别 是 指令 寄存 器 中 操作 码 位 的 值 。 这 
个 电路 对 模块 输入 /输出 约定 有 一 个 例外 : 它 的 输入 在 顶部 ， 而 它 的 输出 分 布 在 另外 三 个 
边 上 。 
取 指 令 。 对 取 指 令 的 响应 很 简单 : 线路 直接 选 通 到 MA 多 路 复 用 器 PC 控制 线 ， 指 示 该 
多 路 复 用 器 将 PC 中 的 地 址 传递 到 内 存 作为 地 址 输入 。 


取 指 执行 
取 指 令 写 入 “执行 入 号 入 





操作 码 


CLOCK -halt 


MEMORY write 
输入 总 线 

PC load 

Rmuix ALU 3 
PC increment 
R mux MEMORY PC write 

RmuxiR 

MA mux PC 

R write 
MA mux IR 


IR write 


基于 TOY-8 CPU 的 控制 时 序 的 组 合 电 路 


取 指 写 入 。 对 下 一 个 取 指 写 人 脉冲 的 响应 也 很 简单 : 线路 直接 连接 到 IR 写 (IR write) 
控制 线 。 结 合 取 指令 (刚刚 描述 )， 可 以 将 PC 中 的 地 址 指向 的 内 存 字 加 载 到 IR 中 。 
执行 。CONTROL 中 间 左 侧 的 复 用 器 是 一 个 多 路 选择 器 (demultiplexer)， 它 将 执行 信号 
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的 值 放 在 八 个 输出 行 之 一 上 ， 具 体 哪 行 由 操作 码 指定 。 因 此 电路 的 行为 完全 由 操作 码 决 定 。 
例如 ， 如 果 操 作 码 指 定 一 个 异 或 操作 ， 则 多 路 选择 器 将 激活 往 下 数 第 三 行 ， 从 而 激活 ALU 
的 蜡 或 控制 线 以 及 R 复 用 器 的 ALU 选 通 。 你 可 以 通过 激活 你 所 预期 的 控制 线 来 更 好 地 了 解 
该 电路 ， 并 参考 上 一 小 节 中 的 表格 。 跳 转 指 令 (branch if zero) 具有 特殊 性 ， 即 若 R 上 的 所 
有 位 为 0， 则 跳 转 会 生成 PC 上 的 加 载 控制 信号 。 若 指令 不 是 跳 转 或 者 R 上 任意 一 位 不 是 0， 
非 门 就 会 生成 PC 的 增 量 控制 。 

执行 写 入 。 图 中 右 侧 的 多 路 分 配器 是 一 个 开关 ， 它 会 把 执行 写 人 信号 的 值 传输 到 八 个 输 
出 线 之 一 ， 具 体 哪个 线 由 操作 码 指定 。 同 样 ， 电 路 的 行为 因此 完全 由 操作 码 决定 。 复 用 器 输 
出 分 成 了 多 路 ， 分 别 对 应 add、xor、and、load address 和 load， 这 些 信和 号 最 后 进入 一 个 或 门 ， 
激活 通用 寄存 器 R 的 写 信 号 ， 使 得 适当 的 值 存 储 到 R 中 ; store 指令 针对 的 多 路 复 用 器 输出 
直接 激活 内 存 写 入 (memory write) 信和 号， 使 得 通用 寄存 器 R 的 内 容 被 存储 到 内 存 中 。 执 行 
写 入 信号 的 写 和 信使 能 信号 也 直接 连接 到 PC 写 和 人 信号， 因此 脉冲 会 同时 将 新 值 加 载 到 PC 中 
(或 者 增加 或 者 从 IR 地 址 线 中 加 载 ， 即 自 增 或 加 载 )。 

举例 : 一 个 TOY-8 程序 ”作为 最 后 一 个 例子 ， 我 们 讨论 一 段 TOY-8 的 系列 控制 信号 ， 
它 的 作用 将 等 价 于 “你 的 第 一 个 TOY 程序 ”， 也 就 是 两 个 数字 求 和 : 


en = ML[5] 

2 26 R=-R + M[6] 

i 时 钟 信和 号 激活 控制 线 结果 

5 0 之 六 放 

7 00 S > MA mux PC 

我 们 假设 内 存 空间 的 1 到 7 位 置 上 已 经 加 IR write IR = A5 
载 好 了 这 些 数 字 ， 而 PC 被 设置 为 01。 可 以 eh 
想象 一 下 ,程序 员 可 能 是 使 用 开关 和 按钮 (如 ey se 
6.2 节 所 述 ) 传输 的 数据 ， 也 可 能 是 通过 计算 We BCES02 
机 内 的 专用 初始 化 硬件 来 完成 这 些 设置 ,最 终 
结果 都 是 内 存 和 PC 的 起 始 状 态 被 设置 成 了 预 et A 
想 的 状态 。 我 们 感 兴趣 的 是 时 钟 开始 后 发 生 的 i 
事情 。 人 

在 右 图 中 ， 由 时 钟 产 生 了 四 个 信号 的 特 ee 
环 一 一 取 指令 ， 取 指 写 入 ， 执 行 ， 执 行 写 入。 
只 要 时 钟 还 在 工作 ， 就 会 在 这 四 个 信号 之 间 不 0 
断 重 复 。 中 间 一 栏 列 出 了 由 时 钟 信号 激活 的 控 IR write TR Sey 
制 线 序 列 ， 右 边 一 栏 展示 了 内 存 、 代 和 PC 状 MA mi IR 
态 的 变化 。 仔 细 研 究 这 个 图 ， 你 将 理解 本 节 的 ES 大 涯 2 莫 
核心 思想 ; 任何 TOY-8 程序 由 一 系列 周期 性 的 有 PC = 04 
时 钟 信 号 引起 的 控制 线 的 激活 来 实现 。 值 得 一 二 六 
提 的 是 ， 简 单 的 CONTROL 电路 可 以 通过 这 种 和 ee 
方式 实现 TOY-8 的 全 部 指令 集 。 Pa 


“你 的 计算 机 就 是 这 样 工作 的 ……”。 一 个 
小 电路 将 一 个 周期 性 的 时 钟 脉 冲 转换 成 一 个 无 一 个 TOY-8 程序 的 控制 线 激活 序列 
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限 循环 的 时 钟 信号 ， 这 个 循环 引起 一 系列 控制 信号 的 激活 ， 以 改变 机 器 的 状态 一 一 当然 ， 状 
态 的 变化 是 相对 应 机 器 当前 的 状态 而 言 的 ， 当 前 的 状态 是 由 PC (执行 指令 的 地 址 ) 和 IR ( 指 
令 本 身 ， 特 别 是 指令 操作 码 ) 所 决定 的 。 如 果 现 有 再 有 人 问 起 计算 机 的 操作 原理 ， 你 应 该 可 
以 解释 了 。 

展望 ”在 后 面 ， 你 将 看 到 一 个 我 们 所 描述 的 TOY-8 CPU 的 完整 电路 ， 详 细 到 可 以 从 底 
层 开关 级 来 分 析 电 路 。 到 此 ， 我 们 实现 了 本 书 中 阐述 的 主要 目标 之 一 一 了 解 计算 机 的 内 部 
工作 原理 。 在 此 ， 还 有 几 个 要 点 值得 回顾 : 

正如 我 们 强调 的 那样 ，TOY-8 与 计算 机 的 主要 区 别 在 于 规模 ， 而 规模 大 小 的 差异 很 容 
易 改 进 。 例 如 ， 我 们 可 以 轻松 地 扩展 设计 ， 将 它 扩 展 成 一 个 32 位 计算 机 ， 配 有 29 位 地 址 和 
2” 个 (超过 5 亿 ) 32 位 字 的 内 存 一 一 当然 这 会 需要 超过 160 亿 个 触发 器 ， 而 现在 的 TOY-8 
只 需要 约 150 个 触发 器 。 相 比 之 下 ， 将 指令 数量 加 倍 可 能 需要 一 些 复杂 的 逻辑 ， 但 是 也 可 
能 只 是 控制 电路 翻 倍 ， 相 比 之 下 可 以 忽略 不 计 。 这 里 存在 一 些 夸 大 的 成 分 ， 因 为 TOY-8 的 
ALU 仅 实现 了 三 个 基本 的 运算 操作 ， 现 代 CPU 设计 中 注重 扩展 多 种 操作 ， 包 括 浮 点 数 和 内 
存 管 理 等 。 但 是 ， 我 们 还 是 要 说 明 ， 这 样 的 设计 只 会 使 系统 的 复杂 度 随 着 字 宽 的 增加 而 线性 
增长 ， 而 内 存 的 增加 则 会 呈 指 数 级 增长 。 

正如 我 们 以 前 强调 的 那样 ，TOY-8 和 你 的 计算 机 都 是 汉 “. 诺 依 曼 机 器 一 一 指令 和 数据 之 
间 没 有 区 别 。 当 然 我 们 可 以 在 构建 电路 时 刻意 加 以 区 分 ， 可 以 想象 一 个 电路 由 两 个 不 同 的 存 
储 器 组 成 ， 一 个 用 于 指令 ， 一 个 用 于 数据 。 事 实 上 ， 出 于 安全 原因 ， 人 们 今天 确实 是 这 样 设 
计 电 路 的 。 

布局 在 我 们 的 设计 中 起 着 核心 作用 。 如 前 所 述 ， 数 字 电路 的 抽象 世界 与 真实 的 物质 世界 
之 间 有 着 密切 的 联系 。 现 在 人 们 利用 计算 机 程序 来 绘制 他 们 的 计算 电路 ， 然 后 将 这 些 绘图 发 
送 到 制造 芯片 的 计算 机 驱动 系统 。 

警告 : 本 章 的 目标 是 帮助 你 了 解 计算 机 的 工作 原理 ， 而 不 是 教 你 如 何 建立 最 先进 的 高 性 
能 电路 。 我 们 所 做 的 每 个 设计 选择 都 是 为 了 使 电路 简单 易 懂 。 例 如 ， 我 们 可 能 会 通过 旋转 模 
块 以 节省 设计 空间 。 再 如 ,设计 中 无 须 体现 每 一 个 开关 : 如 果 你 设计 真正 的 计算 机 ， 你 将 会 
用 到 门 (抽象 层次 更 高 的 开关 ) 通常 也 会 用 到 布局 。 不 过 ,我 们 的 要 点 是 : 你 可 以 设计 出 
你 自己 的 计算 机 ， 你 可 以 编写 一 个 程序 来 扩展 这 个 计算 机 的 规模 ， 你 可 以 假想 它 能 够 被 构建 
出 来 。 

如 果 你 要 拿 出 显微镜 ， 以 10 万 倍 左 右 的 倍数 观察 计算 机 上 的 CPU 芯片 (可 以 肯定 的 
是 ,现在 对 你 来 说 可 能 并 不 那么 容易 )， 你 会 发 现 它 与 抽象 的 设计 看 起 来 没有 太 大 的 区 别 。 
当然 ,真正 的 计算 机 会 受到 各 种 各 样 的 物理 约束 ;设计 也 会 更 加 复杂 ;使 用 到 的 模块 类 型 
也 比 我 们 学 到 的 多 ， 因 此 你 可 能 需要 对 设计 过 程 了 解 更 多 才能 看 懂 这 些 细 节 。 即 使 是 这 
样 ， 你 还 是 可 以 认 出 总 线 、 寄 存 器 、 内 存 和 其 他 模块 ， 也 可 以 看 到 每 个 开关 。 相 应 地 ， 对 
现实 条 件 进 行 一 些 妥协 后 ， 我 们 可 以 依据 下 面 图 示 中 的 设计 ， 实 际 制造 一 个 物理 的 TOY-8 
CPU。 
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所 有 的 计算 基于 两 个 简单 的 抽象 一 一 开关 和 时 钟 ， 这 是 一 个 放 之 四 海 丝 准 的 基本 设计 理 
念 。 为 了 使 计算 机 拥有 更 多 的 内 存 和 寄存 器 ， 我 们 需要 更 小 、 更 快 的 开关 和 更 快 的 时 钟 。 与 
从 头 开始 构建 新 设计 相 比 ， 充 分 利用 微小 的 技术 改进 来 构建 更 好 的 计算 机 的 便利 性 ， 使 得 计 
算 机 发 展 到 今天 却 具备 相同 的 基本 架构 。 但 是 也 不 能 否认 架构 创新 可 能 会 成 为 计算 机 发 展 的 
新 领域 。 
问答 环节 

问 : 我 不 敢 相信 构建 计算 机 设备 如 此 简单 。 真 的 这 就 全 部 讲 完了 吗 ? 

答 : 欢迎 进入 计算 机 世界 ! 当然 ， 在 现代 计算 机 芯片 开发 的 过 程 中 ， 需 要 完善 许多 许多 
细节 ， 这 也 使 得 过 去 几 十 年 中 计算 机 得 到 不 断 的 改进 和 深入 的 研究 。 不 过 ， 在 纸 上 画 几 千 条 
线段 和 点 是 一 回 事 ， 在 几 平 方 厘米 的 空间 内 构建 数 十 亿 的 物理 设备 ， 并 使 得 它们 在 一 秒 钟 内 
操作 十 亿 次 ， 则 是 另 一 回 事 了 。 

当然 , 我们 在 设计 图 纸 上 设 计 二 个 物理 电路 时 ， 在 实际 过 程 中 尚 有 许多 需要 改进 的 地 
方 ， 不 胜 枚 举 。 但 我 们 讲解 的 模型 和 组 件 都 是 非常 经 典 的 ， 可 以 经 受 住 现实 和 物理 条 件 的 无 
数 次 考验 ， 并 能 够 以 多 种 方式 实际 运用 。 

不 过 ， 这 仍然 只 是 一 个 开端 。 自 20 世纪 中 叶 发 明 第 一 台 计 算 机 以 来 ， 我 们 并 未 走 多 远 。 
许多 细节 以 及 许多 在 现代 CPU 操作 背后 的 基本 设计 理念 依然 与 TOY-8 没有 什么 不 同 。 
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7.5.1 设计 一 个 TOY-8 程序 ， 可 以 实现 两 个 8 位 二 进 制 补 码 数字 之 间 的 减法 。 

7.5.2 ”设计 一 个 TOY-8 程序 ， 将 小 于 256 的 所 有 斐 波 那 契 数列 在 标准 输出 上 打 孔 显示 出 来 。 

7.5.3 ”设计 一 个 TOY-8 程序 ， 可 以 将 两 个 8 位 整数 相 乘 ( 正 负数 均 可 )。 若 需要 ， 假 设 内 存 为 32 字 
节 。 注 意 : 为 防止 混淆 ;假设 内 存 分 成 了 两 个 区 ,分 别 是 M0[] 和 MI1[]， 这 样 ， 指 令 36 就 表示 
“将 RR 与 M1[6] 的 数值 相 加 后 的 结果 写 回 到 R 中 ”。 

7.5.4 证明: 内 存 位 0 上 永远 是 0. 

7.5.5 ”如 果 在 TOY-8 机 上 实现 branch 和 link 指令 ， 需 要 什么 样 的 总 线 连接 。 

7.5.6 ”在 我 们 的 TOY-8 CPU 电路 里 有 多 少 个 开关 ? 设计 一 个 表格 ， 展 示 每 个 模块 的 开关 数 以 及 总 数 
(用 百分数 表示 )。 

7.5.7 在 本 节 开 始 ， 我 们 设计 了 一 个 计算 标准 输入 上 数字 总 和 的 TOY-8 程序 “请 给 出 这 一 程序 对 应 的 
控制 线 激活 序列 。 


创新 练习 


7.5.8 ”计数 器 PC。 用 计数 器 ( 见 练 习 7.3.15 ) 而 不 是 增 量 器 设计 一 个 4 位 PC。 
7.5.9 ”设计 一 个 计算 机 。 人 参考 本 章 结尾 处 的 TOY8 的 设计 图 ， 设 计 一 个 完整 的 计算 机 。 可 以 将 练习 
7.3.15 和 7.3.18、7.3.8 和 7.3.11 相 结合 后 进行 扩展 。 
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在 这 里 ,我们 先 对 本 书 中 的 编程 和 计算 机 科学 方面 的 知识 进行 总 结 ， 然 后 再 简单 介绍 
今后 你 可 能 会 遇 到 的 计算 机 理论 。 若 你 能 够 通过 本 书 体会 到 你 身边 世界 中 计算 机 理论 的 重要 
性 ， 那 将 是 我 们 莫大 的 荣幸 。 

我 们 在 第 1 章 到 第 4 章 中 介绍 了 如 何 编程 。 正 如 你 学 会 了 如 何 驾 驶 轿车 后 就 不 会 难于 
掌握 驾驶 SUV 了， 同样 地 ， 更 换 语言 并 不 会 导致 你 难以 编程 。 许 多 程序 员 会 根据 不 同 的 目 
的 选择 不 同 的 程序 语言 。 在 第 1 章 到 第 3 章 中 ， 我们 学 习 的 是 许多 程序 语言 中 通用 的 基本 概 
念 ， 诸如: 数据 类 型 、 条 件 、 循 环 、 数 组 、 第 1 章 和 第 2 章 中 的 函数 (在 计算 机 发 明 最 初 的 
几 十 年 中 程序 员 一 直 在 使 用 这 些 函 数 )， 第 3 章 中 的 面向 对 象 程序 设计 思路 (这 也 是 现代 程 
序 设计 思路 )。 在 此 基础 上 ， 加 上 在 第 4 章 中 学 习 的 基本 数据 类 型 ， 将 使 你 可 以 处 理 库 、 程 
序 开发 环境 、 各 种 专业 应 用 等 。 这 些 也 使 你 在 设计 和 理解 复杂 系统 时 更 深刻 地 体会 到 理论 的 
力量 。 

第 5 章 到 第 7 章 更 多 的 是 介绍 了 计算 机 科学 ， 而 非 编 程 。 在 你 对 编程 逐步 熟悉 和 具备 计 
算 的 能 力 后 ， 你 可 以 学 习 到 20 世纪 杰出 研究 成 果 ， 甚 而 是 悬而未决 的 难题 ， 以 及 可 以 了 解 
到 他 们 在 我 们 周围 的 计算 设备 和 环境 中 起 到 的 作用 。 正 如 我 们 在 本 书 中 不 断 提 示 的 那样 ， 计 
算 机 在 对 于 我 们 理解 真实 世界 的 过 程 中 (从 基因 组 学 到 分 子 动力 学 ， 再 到 天 体 物 理学 ) 发 挥 
了 越 来 越 重要 的 作用 ， 而 人 类 也 必 将 从 计算 机 科学 中 越 来 越 多 地 获 利 。 

Java 库 Java 系统 为 用 户 提 供 了 极为 丰富 的 库 资源 ， 我 们 会 大 量 地 使 用 其 中 某 些 Java 
库 如 Math 、String 等 ， 但 也 可 以 将 其 中 某 些 忽略 。Java 库 的 共同 点 之 一 是 有 大 量 的 有 关 库 的 
在 线 信息 可 供 使 用 。 若 你 尚未 遍 览 Java 库 ， 现 在 就 可 以 尝试 去 做 。 你 会 发 现 ， 这 些 代 码 中 
的 大 多 数 是 供 专业 程序 开发 人 员 使 用 的 ， 但 其 中 也 有 众多 库 适 合 初学 者 使 用 。 当 学 习 库 时 ， 
应 保持 “我 可 能 会 用 到 它 ” 的 心态 ， 而 非 “我 一 定 要 用 它 ” 的 心态 。 凡 遇 到 看 上 去 会 有 用 的 
API， 就 学 会 并 掌握 它 ! 

编程 环境 ”将 来 你 肯定 会 遇 到 基于 Java 的 其 他 编程 环境 。 众 多 程序 员 ， 即 便 是 那些 
富有 经 验 的 程序 员 ， 也 会 因为 代码 积累 过 量 ， 而 在 传统 的 编程 语言 如 C 语言 、C++ 语言 、 
Fortran 语言 与 现代 编程 工具 如 Ruby、Python 和 Scala 之 间 产 生 混淆 。 若 你 想 学 习 Python 语 
言 ， 你 可 以 参考 本 书 的 姊妹 篇 一 一 《 An Introduction to Programming in Python 》。 当 你 在 编 
程 时 ， 你 需要 时 刻 记 住 没有 哪 种 语言 是 必须 使 用 的 ， 若 有 更 好 的 选择 ， 那 么 我 们 就 毫 不 犹 隔 
地 做 出 选择 。 我 们 坚信 ， 固 守 单 一 的 编程 环境 会 导致 你 错过 更 好 的 机 会 。 

科学 计算 ”数字 计算 因 其 对 准确 性 和 精确 度 的 要 求 会 显得 非常 棘手 ， 因 此 对 于 数学 函 
数 库 的 使 用 会 特别 地 实用 。 例 如 ， 许 多 科学 家 使 用 的 是 Fortran 语言 ， 这 是 一 种 较为 老 旧 的 
语言 ; 还 有 一 些 科 学 家 使 用 Matlab 语言 ， 这 是 一 种 专门 为 计算 矩阵 开发 的 语言 。 优 秀 的 库 
和 内 置 的 矩阵 操作 结合 ， 使 得 Matlab 语言 适用 于 众多 问题 。 但 由 于 Matlab 不 支持 自 定 义 
数据 类 型 和 其 他 现代 工具 ， 使 得 Java 具有 更 广泛 的 应 用 。 而 两 者 都 可 为 你 所 用 ! Matlab 和 
Fortran 编程 人 员 使 用 的 数学 库 与 Java (及 其 他 现代 编程 语言 ) 的 库 非 常 接近 。 
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应 用 程序 ( APP) 和 云 计算 ”如 今 计 算 机 开发 和 使 用 的 众多 程序 都 可 以 在 浏览 器 或 移动 
设备 上 运行 ， 甚 而 是 云端 。 而 这 一 现象 对 大 多 数 人 群 产 生 了 积极 的 影响 。 若 你 感受 到 了 计算 
这 一 利 处 ， 那 么 很 有 可 能 你 也 会 被 本 书 讨论 的 这 些 方法 震撼 到 。 你 可 以 编写 程序 来 处 理 非 本 
地 的 数据 ， 也 可 以 编写 程序 在 别处 运行 ， 而 这 些 都 得 力 于 计算 设备 的 扩展 和 进化 。 我 们 的 焦 
点 放 在 理解 这 些 现象 的 科学 理论 上 ， 这 使 得 你 可 以 更 大 规模 地 运用 计算 。 

计算 机 系统 早期, 计算 机 系统 的 特点 决定 了 它 能 够 解决 的 问题 的 性 质 和 外 延 ， 但 现在 
完全 不 是 这 样 。 你 可 以 期 望 更 大 的 内 存 、 更 快 的 设备 ， 尽 可 能 保持 代码 机 器 的 独立 性 ， 努 力 
学 习 和 开发 从 GPU 到 大 规模 并 行 计算 机 和 网 络 的 各 种 新 技术 。 

计算 理论 与 这 些 机 会 形成 对 比 的 是 计算 本 身 的 各 种 基本 限制 ， 这 些 理论 的 限制 是 计算 
机 与 生 俱 来 的 ， 而 且 会 在 发 展 的 过 程 中 一 直 存 在 并 起 到 关键 性 作用 。 如 你 所 知 ， 我 们 仍然 有 
很 多 问题 尚未 有 计算 机 程序 可 以 解答 ， 甚 至 也 有 很 多 问题 (如 练习 中 列举 的 一 些 )， 在 可 想 
象 的 计算 机 上 也 难以 解决 。 无 论 是 谁 从事 问 题解 决 与 创造 性 任务 或 研究 ， 若 依赖 于 计算 ， 都 
必须 承认 这 一 事实 。 

机 器 学 习 长 久 以 来 ， 人 工 智能 (artificial intelligence) 都 是 计算 机 科学 的 一 个 重要 领 
域 。 现 代 计 算 机 的 广泛 应 用 意味 着 早期 计算 机 科学 家 的 部 分 梦想 已 经 实现 ， 而 计算 机 已 发 展 
到 能 够 从 其 环境 中 实现 自我 学 习 ， 从 无 人 驾驶 汽车 到 心仪 商品 推送 ， 甚 而 指导 人 类 应 该 学 习 
的 内 容 。 这 一 层次 的 学 习 显 然 要 比 学 习 任 一 系列 的 API 或 者 开发 任 一 语言 都 更 为 重要 。 

从 尝试 着 编写 、 编 译 、 运 行 第 一 个 程序 HelloWorld 开始 至 今 ， 你 已 学 习 到 了 大 量 的 知 
识 , 但 今后 还 有 更 长 的 路 要 走 。 一 个 人 若 坚 持 不 懈 地 编程 ， 坚 持 不 懈 地 学 习 编 程 环境 、 科 学 
计算 、 应 用 程序 、 云 计算 和 计算 机 系统 、 计 算 理论 、 机 器 学 习 等 内 容 ， 必 然 会 获得 难以 想象 
的 、 比 不 懂 计 算 机 科学 的 人 更 多 的 机 会 。 


术 


abstract machine (抽象 机 ): 用 于 计算 的 数学 模型 。 

adder (加 法 器 ): 用 于 计算 两 个 数字 相 加 和 的 计算 
机 组 件 。 

algorithm (算法 ): 用 于 求解 某 个 问题 的 分 布 过 
程 ， 如 欧 几 里 得 算法 、 归 并 排序 和 任何 一 种 
图 灵机 。 

alias( 别 名 ): 引用 同一 对 象 的 两 个 (或 多 个 ) 变量 。 

alphabet (字母 表 ) : 一 种 有 限 的 符号 集 ,， 如 二 进 
制 字母 {a, b}。 

ALU (算术 逻辑 单元 ): 计算 机 的 计算 引擎 。 

API ( Application Programming Interface， 应 用 程 
序 接口 ): 描述 客户 端 如 何 使 用 一 个 数据 类 型 
的 一 系列 操作 的 规范 说 明 。 

array (数组) : 用 于 存储 一 系列 元 素 的 数据 结构 ， 
支持 创建 、 索 引 访问 、 索 引 赋值 和 迭代 操作 。 

argument (参数 ): 用 于 Java 计算 的 、 传 递 给 函数 
的 对 象 引用 。 

ASCII (American Standard Code for Information 
Interchange， 美 国信 息 交 换 标准 代码 ) : 一 
种 广泛 使 用 的 英文 文本 编码 标准 ， 被 纳入 
Unicode 中 。 

assignment statement (赋值 语句 ): 一 种 Java 语 
句 ， 包 括 一 个 变量 名 后 跟 一 个 等 号 (=)， 再 
紧 跟 一 个 表达 式 ， 指 示 Java 对 该 表达 式 进 行 
求 值 ， 并 把 计算 结果 赋值 给 该 变量 。 

bit (位 ): 二 进 制 位 (0 或 1) 之 一 。 

Boolean algebra (布尔 代数 ) : 用 于 布尔 表达 式 符 
号 操作 的 正式 系统 。 

boolean expression (布尔 表达 式 ) : 一 个 表达 式 ， 
其 值 为 boolean 类 型 。 

boolean function 《布尔 函数 ) : 将 布尔 值 映射 为 布 
尔 值 的 函数 。 

Boolean logic (布尔 逻辑 ): 布尔 函数 的 研究 

boolean value (布尔 值 ): 0 或 1， 真 或 假 。 


语 


表 


booksite library (官网 库 ) : 本 书 作 者 创建 的 库 ， 
如 StdIn、StdOut、StdDraw 和 StdAudio 等 。 

built-in type (内 置 数据 类 型 )， Java 语言 中 内 置 的 
数据 类 型 ， 如 int、double、boolean 、char 和 
String。 

bus connection (总 线 连接 ): 具体 参见 data path。 

bus mux (总 线 多 路 复 用 器 ) : 用 于 切换 总 线 连接 
的 多 路 复 用 器 。 

buzzet 蜂 鸣 器 ): 电路 中 的 一 个 不 稳定 的 反馈 回路 。 

Church-Turing thesis ( 印 奇 -图 灵 论 题 ): 任何 
在 物理 真实 计算 设备 上 可 以 描述 的 问题 可 
以 由 图 灵机 计算 (理解 一 门 语言 或 计算 一 个 
函数 )。 

circuit (电路 ): 导线 、 电 源 连 接 和 开关 的 互连网 络 。 

class( 类 ): 用 于 实现 自 定 义 数 据 类 型 的 Java 构造 ， 
可 以 提供 模板 来 创建 和 操作 包含 该 类 型 值 的 
对 象 ， 由 API 定义 其 实现 的 程序 。 

.class file ( .class 文件 ) : 扩展 名 为 .class 的 文件 ， 
包含 Java 字 节 码 ， 适 合 在 Java 虚 拟 机 上 
执行 。 

class variable (类 变量 ): 具体 参见 static variable。 

client (客户 端 ): 通过 API 使 用 其 实现 的 程序 。 

clock (时 钟 ): 一 种 时 序 电 路 ， 用 于 对 处 理 器 中 的 
取 指 和 执行 控制 线 进行 排序 。 

combinational circuit (组 合 电 路 ) : 没有 环 路 的 
电路 。 

command line (命令 行 ) : 终端 应 用 程序 的 当前 活 
动 行 ， 用 于 调用 系统 命令 的 运行 程序 。 

command-line argument (命令 行 参数 ) : 在 命令 行 
传递 给 程序 的 字符 串 。 

comment (注释 ) : 用 于 帮助 读者 理解 代码 目的 的 
解释 性 文本 (被 编译 器 忽略 )。 

comparable data type( 可 比较 的 数据 类 型 ) : 一 种 
Java 数据 类 型 ， 它 实现 了 Comparable 接口 
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并 定义 了 全 序 关系 。 

compile-time error (编译 错误 ) : 由 编译 器 发 现 的 
错误 。 

compiler (编译 器 ) : 把 一 个 程序 从 高 级 语言 翻译 
成 低级 语言 的 程序 。Java 编译 器 将 .java 文件 
(包含 Java 源 代 码 ) 翻译 为 .class 文件 (包含 
Java 字 节 码 )。 

computability (可 计算 性 ) : 在 计算 机 上 解决 问题 
的 能 力 ， 某 些 问题 (如 停机 问题 ) 是 不 可 计 
算 的 。 

conditional statement (条 件 语句 ) : 一 种 根据 一 个 
或 多 个 布尔 表达 式 的 值 来 执行 不 同 计算 的 语 
句 ， 如 if、if-else 或 switch 语句 。 

constant variable( 常 变量 ) : 在 程序 编译 时 已 知 且 
在 程序 执行 过 程 中 (或 从 程序 的 一 次 执行 到 
下 一 次 执行 期 间 ) 保持 不 变 的 变量 。 

constructor (构造 函数 ) : 一 种 用 于 创建 和 初始 化 
一 个 新 对 象 的 特殊 方法 。 

control (控制 ) : 组 合 电路 ， 用 于 组 织 处 理 器 中 的 
控制 线 。 

control line (控制 线 ): 带 有 控制 信号 (与 数据 值 
相对 ) 的 导线 。 

controlled switch (控制 开关 ): 可 以 断 开 连接 的 电 
路 元 件 。 

CPU ( Central Processing Unit) : 实现 计算 机 的 
电路 。 

data path (数据 路 径 ) : 连接 一 个 模块 到 另 一 个 模 
块 的 一 组 电线 (也 称 为 总 线 连接 ) 。 

data structure (数据 结构 ) : 在 计算 机 中 组 织 数 据 
的 方式 (通常 用 于 节省 时 间或 空间 )， 如 数 
组 、 可 变数 组 、 链 表 和 二 又 搜索 树 。 

data type (数据 类 型 ) : 一 系列 值 的 集合 以 及 定义 
在 这 些 值 上 的 一 系列 操作 的 集合 。 

declaring a variable (声明 一 个 变量 ): 指定 一 个 变 
量 的 名 称 和 类 型 。 

decoder (解码 器 ): 用 于 选择 输出 的 组 合 电 路 。 

demultiplexer (多 路 分 配器 ) : 一 种 组 合 电 路 ， 用 
于 将 输入 切换 到 所 选择 的 输出 。 

deterministic( 确 定性 ): 一 种 计算 ， 其 中 每 个 步 
又 完全 由 当前 状态 决定 。 


deterministic finite-state automaton (确定 有 限 状 
态 自动 机 ，DFA) : 能 够 识别 常规 语言 的 确定 
性 抽象 机 器 。 

element (元 素 ): 数组 中 的 一 个 对 象 。 

evaluate an expression (表达 式 求 值 ) : 通过 在 表 
达 式 中 应 用 运算 符 计 算 操 作 数 ， 把 一 个 表达 
式 简 化 为 一 个 值 。 运 算 符 优先 级 、 运 算 符 结 
合 律 和 计算 顺序 决定 了 将 运算 符 应 用 于 操作 
数 的 顺序 。 

exception (异常 ): 程序 运行 时 的 一 种 异常 情况 或 
错误 。 

exponential-time algorithm (指数 运行 时 间 算 法 ) : 
一 种 以 输入 规模 的 指数 函数 为 运行 时 间 限 制 
的 算法 。 

expression (表达 式 ) : 字面 量 、 变 量 、 运 算 符 和 
函数 调用 的 组 合 ，Java 可 以 将 其 化 简 为 一 
个 值 。 

fetch-increment-execute cycle ( 取 指 -递增 - 执 
行 周期 )， 处 理 计算 机 操作 的 过 程 。 

flip-flop( 触 发 器 ): 一 种 时 序 电 路 ， 可 以 实现 内 
存 位 。 

floating point ( 浮 点 ) : 使 用 “科学 记 数 法 ”来 表 
示 计 算 机 上 实数 的 一 般 描述 (具体 参见 IEEE 
7 于 

formal language (形式 语言 ): 给 定 字母 表 上 的 一 
系列 字符 串 。 

function (函数 ): 具体 参见 static method。 

functional interface (函数 式 接口 ): 只 包含 一 个 抽 
象 方法 的 接口 。 

garbage collection (垃圾 回收 ): 自动 识别 不 再 使 
用 的 对 象 并 释放 其 占用 内 存 的 过 程 。 

gate( 门 ) : 一 种 小 型 组 合 电路 ， 用 于 实现 一 个 布 
尔 函 数 ， 如 与 门 、 或 门 、 非 门 等 。 

generalized regular expression pattern match (广义 
正则 表达 式 模式 匹配 ，grep) : 一 个 使 用 正则 
表达 式 搜索 模式 的 经 典 方法 。 

generic class( 泛 型 类 ): 由 一 个 或 多 个 类 型 参数 参 
数 化 的 类 ， 如 Queue、Stack、ST 或 SET。 

global variable (全 局 变量 ): 一 个 作用 范围 是 整个 
程序 和 文件 的 变量 ， 具 体 参 见 static variable。 


halting problem (停机 问题 ): 图 灵机 不 可 解 问题 。 

hashing( 散 列 ): 将 数据 类 型 值 转换 为 给 定 范围 内 
的 整数 ， 使 得 不 同 的 键 不 太 可 能 映射 到 同一 
整数 。 

hash table〈 散 列表 ): 基于 散 列 的 符号 表 实 现 。 

hexadecimal(〈 十 六 进 制 ): 整数 的 Base-16 表示 。 

identifier (标识 符 ) : 用 于 识别 变量 、 函 数 、 类 、 
模块 和 其 他 对 象 的 名 称 。 

IEEE 754 : 浮 点 计算 的 国际 标准 ， 用 于 现代 计算 
机 硬件 (具体 参见 floating point)。 

immutable data type (不 可 变数 据 类 型 ) : 任何 实 
例 的 值 不 可 改变 的 数据 类 型 ， 如 Integer、 
String 或 Complex。 

immutable object (不 可 变 对 象 ): 值 不 可 改变 的 
对 象 。 

implementation (实现 ) : 实现 由 API 定 义 的 一 系 
列 方 法 的 程序 ， 可 被 客户 端 使 用 。 

importstatement (导入 语句 ): 可 引用 其 他 模块 中 
代码 的 一 种 Java 语句 ， 可 以 不 使 用 其 完全 限 
定名 。 

initializing a variable (初始 化 变量 ) : 在 程序 中 第 
一 次 给 变量 赋值 。 

instance (实例 ): 特定 类 的 一 个 对 象 。 

instance method (实例 方法 ) : 数据 类 型 操作 的 实 
现 (针对 特定 对 象 调 用 的 函数 )。 

instance variable (实例 变量 ) : 在 类 中 定义 的 变量 
(但 在 方法 之 外 )， 表 示 数 据 类 型 的 值 (与 类 
的 每 个 实例 关联 )。 

instruction register (指令 寄存 器 ，IR) : 保存 正在 
执行 的 指令 的 机 器 组 件 。 

interface( 接 口 ): 类 的 协议 ， 用 于 实现 一 系列 方法 。 

interpreter (解释 器 ): 逐 行 执行 使 用 高 级 语言 编写 
的 程序 的 一 种 程序 ，Java 虚拟 机 解释 Java 字 
节 码 并 在 你 的 计算 机 上 执行 它 。 

intractability( 难 解 性 ): 在 多 项 式 时 间 内 解决 计算 
机 上 的 问题 的 不 可 能 程度 。 

item (项 ): 集合 中 的 二 个 对 象 。 

iterable data type (可 迭代 数据 类 型 ): 一 种 实现 
Iterable 接口 的 数据 类 型 ， 可 以 与 foreach 循 
环 一 起 使 用 ， 如 Stack 、Queue 或 SET。 


iterator (迭代 器 ) : 实现 Iterator 接口 的 数据 类 型 。 
用 于 实现 可 迭代 的 数据 类 型 。 

Java bytecode (Java 字 节 码 ) : Java 虚拟 机 使 用 的 
低级 、 与 机 器 无 关 的 语言 。 

.java file (.java 文件 ): 一 个 文件 ， 包 含 用 Java 程 
序 设计 语言 编写 的 程序 。 

Java programming language (Java 程序 设计 语言 ): 
一 种 通用 的 、 面 向 对 象 的 程序 设计 语言 。 
Java Virtual Machine ( Java 虚拟 机 ，JVM) : 在 微 
处 理 器 上 执行 Java 字 节 码 的 程序 ， 同 时 使 用 

解释 器 和 即时 编译 器 。 

just-in-time-compiler (即时 编译 器 ) : 在 程序 执行 
时 ， 编 译 器 将 高 级 语言 的 程序 连续 转换 为 低 
级 语言 。 Java 的 即时 编译 器 从 Java 字 节 码 
转换 为 本 机 机 器 语言 。 

Kleene’s theorem ( 克 林 定 理 ): 正则 表达 式 (RE)、 
确定 有 限 状 态 自 动机 CDFA) 和 非 确定 有 限 
状态 自动 机 (NFA) 都 具有 正则 语言 的 特征 
的 概念 。 

lambda calculus (Lambda 演算 ): 阿 隆 索引 入 的 通 
用 计算 模型 。 

lambda expression (Lambda 表达 式 ): 一 个 匿名 函 
数 ， 可 以 在 以 后 传递 和 执行 。 

library ( 库 ): 一 个 .java 文件 ， 具 有 人 允许 其 功能 在 
其 他 Java 程序 中 复 用 的 结构 。 

linked list (链表 ) : 由 一 系列 节点 组 成 的 数据 结 
构 ， 其 中 每 个 节点 包含 对 序列 中 下 一 个 节点 
的 引用 。 

literal (常量 ); 用 于 内 置 数据 类 型 值 的 源 代 码 表 
示 方 式 ， 如 123、'Hello' 和 True。 

local variable (局 部 变量 ) : 在 一 个 方法 中 定义 的 
变量 ， 其 作用 范围 仅 限于 该 方法 。 

loop (循环 ) : 一 种 语句 ， 它 根据 某 些 布尔 表达 式 
的 值 执行 重复 计算 ， 如 for 或 while 语句 。 

machine-language instruction (机 器 语言 指令 ): 内 
置 于 计算 机 硬件 中 的 操作 ， 如 TOY 中 的 添 
加 、 加 载 和 分 支 0。 

machine-language program (机 器 语言 程序 ): 在 计 
算 机 上 执行 的 一 系列 机 器 语言 指令 。 

masking (屏蔽 ); 屏蔽 计算 机 一 字 节 中 的 一 些 位 。 
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memory (内 存 ): 计算 机 的 组 成 部 分 ， 用 于 加 载 
数据 和 指令 。 

method (方法 ): 一 个 被 命名 的 编程 语句 序列 ， 可 
以 被 其 他 代码 调用 以 执行 计算 。 

method call (方法 调用 ) : 一 个 表达 式 ， 用 于 执行 
方法 并 返回 值 。 

modular programming (模块 化 程序 设计 ): 一 种 
编程 风格 ， 强 调 使 用 分 离 、 独 立 的 模块 解决 
任务 。 

module (模块 ， 软 件 层面 ): 实现 一 个 API 的 独立 
程序 ， 如 Java 类 。 

module (模块 ， 硬 件 层面 ): 计算 机 组 件 ， 通常 具 
有 总 线 输入 和 输出 。 

Moore "slaw (摩尔 定律 ) : 戈 登 * 摩尔 ( Gordon 
Moore) 观察 到 这 一 现象 ， 自 20 世纪 560 年 
代 引 入 集成 电路 以 来 ， 处 理 器 功率 和 存储 器 
容量 每 两 年 翻 一 番 。 

multiplexer (多 路 复 用 器 ) : 一 种 组 合 电路 ， 可 将 
选 定 的 输入 切换 为 输出 。 

mutable data type( 可 变数 据 类 型 ): 一 种 数据 类 型 ， 
其 实例 的 值 可 以 更 改 ， 如 Counter、Picture 
或 数组 。 

mutable object (可 变 对 象 ) : 数据 类 型 值 可 以 更 改 
的 对 象 。 

nondeterministic( 不 确定 性 ): 可 以 从 一 个 或 多 个 
状态 进行 多 个 后 续 步 又 的 计算 。 

nondeterministic finite-state automaton ( 非 确 定 有 
限 状 态 自动 机 ，NFA) 一 种 识别 形式 语言 
非 确定 性 抽象 机 器 。 

NP (NP 类 ) : 一 个 集合 ， 包 括 所 有 搜索 问题 ， 如 
布尔 方程 是 否 可 解 、 因 式 分 解 和 了 集合 中 的 
所 有 问题 。 

NP-comiplete (NP 完全 问题 ): NP 中 “最 难 ” 问 
题 的 代表 ， 如 布尔 方程 可 解 性 、 顶 点 覆盖 问 
题 和 整数 线性 不 等 式 可 解 性 。 

null reference ( 空 引用 ): 特殊 的 字面 量 null， 表 
示 对 空 对 象 的 引用 。 

object 对象) : 特定 数据 类 型 的 一 个 值 在 计算 机 
内 存 中 的 表示 ， 其 特性 包括 状态 (数据 类 型 
值 )、 行为 (数据 类 型 操作 ) 和 标识 (存储 器 


中 的 位 置 )。 

object-oriented programming( 面 向 对 象 程序 设计 ): 
一 种 编程 风格 ， 强 调 使 用 数据 类 型 和 对 象 来 
对 现实 世界 或 抽象 实体 进行 建 模 。 

object reference (对 象 引 用 ) : 对 象 标 识 的 具体 表 
示 ( 对 象 存储 的 内 存 地 址 )。 

operand (操作 数 ): 运算 符 作用 的 对 象 。 

operating system (操作 系统 ) : 运行 在 计算 机 上 的 
程序 ， 用 于 管理 资源 ， 为 各 种 程序 和 应 用 提 
供 通 用 服务 。 

operator (运算 符 ) : 表示 内 置 数据 类 型 操作 的 一 
种 特殊 的 符号 (或 一 系列 符号 )， 如 +、-、 
* 和 []。 

operator associativity (运算 符 结合 律 ); 一 种 规则 ， 
用 于 确定 在 使 用 具有 相同 优先 级 的 运算 符 时 
的 顺序 ， 如 1-2=3。 

operator precedence (运算 符 优 先 级 ) : 一 种 规则 ， 
用 于 确定 在 表达 式 中 应 用 运算 符 的 顺序 ， 如 
2 

order of evaluation (计算 顺 序 ): 子 表达 式 中 的 计 
算 顺 序 。 无 论 运算 符 优先 级 还 是 运算 符 结合 
律 ，Java 都 会 从 左 到 右 计算 子 表 达 式 。 在 调 
用 方法 之 前 ，Java 会 从 左 到 右 计 算 方法 参数 。 

overflow (溢出 ) : 当 算术 运算 结果 的 值 超过 最 大 
可 能 值 时 会 导致 游 出 。 

overloading a method ( 重 载 一 个 方法 ) : 使 用 相同 
名 称 ( 但 不 同 的 参数 列表 ) 定义 两 个 或 多 个 
方法 8 

overloading an operator ( 重 载 一 个 运算 符 ) : 为 一 
个 数据 类 型 定义 一 个 运算 符 (如 +、*、<= 和 
[]) 的 行为 ，Java 不 支持 运算 符 重 载 。 

overriding a method ( 重 写 一 个 方法 ); 重新 定义 
继承 的 方法 ， 如 equals() 和 hashCode()。 

P (了 集合 ) : 一 个 集合 ， 包 括 多 项 式 时 间 算 法 的 
所 有 搜索 问题 ， 如 排序 、 最 短路 径 和 线性 不 
等 式 可 解 性 。 

P 关 NP conjecture (P 关 NP 猜想 ) : 一 个 众所周知 
的 猜想 是 : 一 些 搜索 问题 无 法 在 多 项 式 时 间 
内 被 解决 。 

package( 包 ): 共享 公共 命名 空间 的 相关 类 和 接 


口 的 集合 。 包 java.lang 包含 最 基本 的 类 和 
接口 ， 并 自动 导入 ; 包 java.util 包含 Java 的 
Collections Framework。 

paper tape( 纸 带 ): 一 种 早期 原始 的 输入 /输出 
媒介 。 

parameter Variable (参数 变量 ) : 在 函数 定义 中 指 
定 的 变量 ， 调 用 函数 时 初始 化 为 对 应 的 参数 。 

parsing (分 析 ): 将 字符 串 转换 为 内 部 表示 。 

pass by value ( 按 值 传递 ) : Java 将 方法 传递 给 方 
法 的 方式 ， 即 通过 作为 数据 类 型 值 (对 于 基 
本 类 型 ) 或 作为 对 象 引用 (对 于 引用 类 型 ) 的 
方式 传递 。 

PDP-8: 20 世纪 70 年 代 使 用 的 真正 计算 机 。 

polymorphism (多 态 性 ) : 不 同 的 数据 类 型 使 用 相 
同 的 API (或 部 分 API)。 

polynomial-time algorithm (多 项 式 时 间 算 法 ): 能 
够 保证 在 输入 规模 的 某 些 多 项 式 函 数 时 间 内 
运行 的 算法 。 

polynomial-time reduction (多 项 式 时 间 归 约 ): 使 
用 子 程序 解决 一 个 问题 ， 以 帮助 有 效 地 解决 
另 一 个 问题 。 

primitive data type (基本 数据 类 型 ) : Java 定 义 
的 八 种 数据 类 型 之 一 ， 包 括 boolean 、char、 
double 和 int。 基 本 类 型 的 变量 存储 数据 类 型 
值 本 身 。 

private (私有 ) : 不 被 客户 端 引用 的 数据 类 型 的 实 
现代 码 。 

program (程序 ): 在 计算 机 中 执行 的 指令 序列 。 

program counter (程序 计数 器 ，PC) : 保存 下 一 条 
要 执行 的 指令 的 地 址 的 机 器 组 件 。 

pure function ( 纯 函 数 ) : 给 定 相同 的 参数 ， 时 钟 
返回 相同 值 且 不 产生 任何 可 观察 到 的 副作用 
的 函数 。 

reduction( 归 约 ): 使 用 子 程序 解决 另 一 个 问题 。 

reference type (引用 类 型 ) : 一 种 类 型 、 接 口 类 型 
或 数组 类 型 ， 如 String、Charge、Comparable 
和 int []。 引 用 类 型 的 变量 存储 的 是 对 象 引 
用 ， 而 不 是 数据 类 型 值 本 身 。 

register (寄存 器 ): 包含 要 处 理 的 内 容 的 机 器 组 件 。 

regular expression (正则 表达 式 ，RE): 一 个 表达 
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式 ， 它 使 用 并 集 、 连 接 、 闭 包 和 括号 来 规定 
形式 语言 。 

regular language (正则 语言 ): 可 由 DFA 识别 或 由 
正则 表达 式 规定 的 语言 。 

resizing array (可 变数 组 ) : 一 种 数据 结构 ， 用 于 
确保 使 用 数组 的 恒定 比例 部 分 被 使 用 

return value (返回 值 ) : 作为 函数 调用 结果 提供 给 
调用 者 的 值 。 

run-time error 《运行 时 错误 ): 程序 执行 时 发 生 的 
错误 。 

satisfiability( 可 满足 性 ): 对 于 一 组 给 定 的 方程 (或 
不 等 式 )， 是 否 存在 一 组 变量 的 值 ， 使 得 这 组 
方程 (或 不 等 式 ) 为 真 。 

scope of a variable (变量 的 作用 域 ): 一 个 变量 或 
名 称 可 以 被 直接 访问 的 程序 区 域 。 

search problem (搜索 问题 ): 一 个 问题 ， 存 在 多 项 
式 时 间 的 算法 ， 可 以 检查 任何 声称 有 效 的 解 
决 方案 是 否 确实 有 效 。 

side effect (副作用 ): 一 种 状态 的 改变 ， 如 打印 输 
出 、 读 取 输 入 、 抛 出 错误 或 更 改 某 些 持久 对 
象 (实例 变量 、 参 数 变量 或 全 局 变量 ) 的 值 。 

sequential circuit (时 序 电路 ) : 具有 环 路 (反馈 ) 
的 电路 。 

source code( 源 代码 ): 高 级 程序 设计 语言 (如 
Java) 中 的 程序 或 程序 片段 。 

standard input, output, drawing, and audio (标准 输 
入 、 标 准 输出 、 标 准 绘图 、 标 准 音频 ) : 本 书 
提供 的 Java 输入 输出 模块 。 

statement (语句 ) : Java 可 以 执行 的 一 条 指令 ， 如 
赋值 语句 、if 语 句 、while 语句 和 return 语句 。 

static method (静态 方法 ) : 在 Java 类 中 实现 的 函 
数 ， 如 Math.abs()、Euclid.gcd(.StdIn.readInt()。 

static variable (静态 变量 ): 与 类 关联 的 变量 。 

string (字符 串 ): 有 限 的 字母 符号 序列 。 

sum-of-products representation (“ 积 之 和 ”表示 ) : 
布尔 函数 的 标准 代数 表示 形式 。 

terminal window (终端 窗口 ) : 接受 命令 的 操作 系 
统 的 应 用 程序 。 

this: 在 实例 方法 或 构造 函数 中 ， 引 用 正在 调用 其 
方法 或 构造 函数 的 对 象 的 关键 字 。 
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throw an exception ( 抛 出 一 个 异常 ) : 发 出 编译 时 
或 运行 时 错误 信和 号。 

TOY : 一 个 虚构 的 计算 机 ， 类 似 于 PDP-8， 专 为 
本 书 而 设计 。 

trace (追踪 ): 逐步 描述 程序 的 操作 。 

Turing machine (图 灵机 ，TM): 由 艾 伦 . 图 灵 引 
入 的 通用 计算 模型 。 

two’s complement representation (二 进 制 补 码 表 
示 ): 在 计算 机 中 表示 负 整 数 的 公约 。 

type parameter (类 型 参数 ) : 泛 型 类 中 的 占 位 符 ， 
用 于 客户 端 指定 的 某 种 具体 类 型 。 

Unicode: 文本 编码 的 国际 标准 。 

unit testing (单元 测试 ) : 在 每 个 模块 中 包含 用 于 
测试 其 代码 的 实践 方法 。 

universal Turing machine (通用 图 灵机 ，UTM ) : 
一 种 图 灵机 ， 可 以 在 任意 输入 上 模拟 任意 图 
灵机 。 


universality (普遍 性 ): 所 有 足够 强大 的 计算 设备 
可 以 决定 同一 组 形式 语言 并 计算 同一 组 数学 
函数 的 想法 。 

variable (变量 ): 拥有 值 的 实体 。 每 个 Java 变量 
都 包含 名 称 、 类 型 和 范围 。 

Virtual machine (虚拟 机 ): 作为 男 一 台 计 算 机 上 
程序 的 计算 机 的 定义 或 实现 。 

von Neumann machine ( 冯 : 诺 依 曼 机 器 ) : 计算 
机 的 体系 结构 ， 其 中 指令 和 数据 存储 在 同一 
存储 器 中 。 

wire (导线 ): 带 有 布尔 值 的 电路 元 件 。 

word ( 字 ): 国定 长 度 的 位 序列 ， 作 为 计算 机 体系 
结构 中 的 一 个 单元 处 理 。 

wrapper type (封装 类 型 ): 与 其 中 一 种 基本 类 
型 对 应 的 引用 类 型 ， 如 Integer、Double、 


Boolean 和 Character。 
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A-format instructions (A 格式 指令 )，911 
Absolute value function (绝对 值 函数 )，199 
Absorption identity (吸收 律 恒等式 )，990 
Abstract machines (抽象 机 )，737-738 
Abstract methods (抽象 模型 )，446 
Abstraction (抽象 ) 

color (颜色 )，341-343 

circuits (电路 )，1037-1039 

data (数据 )，382 

displays (显示 )，346 

function-call (函数 调用 )，590-591 

libraries( 库 )，230, 429 

object-oriented programming (面向 对 象 编程 )，329 

printing as (打印 )，76 

recursion (递归 )，289 

vs. representation( 各 种 表示 的 对 比 )，69 

standard audio( 标 准 音 频 )，155 

standard drawing〔 标 准 绘图 )，144 

standard IO (标准 TO)，129, 139-143 
Accept states (接受 状态 ) 

DFAs (确定 有 限 状态 自动 机 )，738-739 

Turing machines (图 灵机 )，766-767 
Access modifiers (访问 修饰 符 )，384 
Accessing references (对 象 访问 )，339 
Account information (账户 信息 ) 

dictionary lookup【〈 字 典 查找 )，628-629 

indexing(〈 索 引 )，634 
Accuracy (精度) 

n-body simulation (多 体 模拟 )，488 

random web surfer( 随 机 网 络 冲 浪 )，185 
Adaptive plots( 自 适应 绘图 )，314-318 
Adders (加 法 右 ) 

binary (二 进 制 )，771 

combinational circuits (组 合 电 路 )，1007 

overview (概述 )，1028 


ripple-carry (进位 加 法 器 )，1028-1030 

sum-of-products ( 积 之 和 )，1028 
AddInts program (程序 AddInts)，134 
Addition (加 法 ) 

complex numbers (复数 )，402-403 

floating-point numbers ( 浮 点 数 )，24-26 

integers (整数 )，22, 884 

negative numbers (负数 )，887 

spatial vectors (空间 癌 量 )，442-443 
Address control lines (地 址 控制 线 )，1056 
Addresses (地 址 ) 

array elements (数组 元 素 )，94 

memory (内存)，909 

symbolic names (符号 名 称 )，981 
Adelman,Leonard ( 伦 纳 德 ， 阿 德尔 曼 )，795 
Adjacency matrix (邻接 矩阵 )，692 
Adjacent vertices (邻接 顶点 )，671 
Albers, Josef (约瑟夫 亚 伯 斯 )，342 
AlbersSquaresprogram ( 程 序 AlbersSquares A 

341-342 

Alex (〈 亚 历 克 斯 )，380 
Algebra (代数 ) 

boolean (布尔 )，989-991 

Vectors( 疝 量 )，442-443 
Algorithms (算法 )，493 

computability (可 计算 性 )，787 

decidability (可 判定 性 )，786-787 

exponential-time (指数 时 间 )，826 

overview (概述 )，786 

performance (性 能 ) 

polynomial-time (多 项 式 时 间 )，825-826 

searching (搜索 ) 

sorting (排序 ) 
Aliasing (别名 ) 

arrays( 数 组)，516 

bugs from (错误 )，439, 441 

references (引用 )，363 
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Allocating memory (分配 内 存 )，94, 367 
Alphabets (字母 表 ) 
formal languages (形式 语言 )，720-721 
metasymbols (元 符号 )，725 
regular expressions (正则 表达 式 )，730 
symbols (符号 表 )，718-719 
ALUs (算术 逻辑 单元 ) 
Amortized analysis( 挫 销 分 析 )，580-581 
Ampersands (&) 
bitwise operations ( 按 位 运算 )，891-892 
boolean type (布尔 类 型 )，26-27, 991 
Analog circuits (模拟 电路 )，1013 
AND circuits in ALUs (ALU 中 的 与 电路 )，1031 
AND gates (与 门 )，1014 
And operation (与 运算 符 ) 
bitwise( 按 位 )，891-892 
boolean type (布尔 类 型 )，26-27, 987-989 
TOY machine (TOY 机 )，913 
Animations (动画 ) 
BouncingBall, 152—153 
double buffering( 双 缓冲 区 )，151 
Annihilation identity ( 0-1 律 定义 ),，990 
Antisymmetric property (反对 称 属 性 ) 546 
Application programminginterfaces( 应 用 程序 编程 
接口 ，API) 
access modifiers (访问 修饰 符 )，384 
Body, 480 
built-in data types (内 置 数 据 类 型 )，30-32 
Charge, 383 
Color, 343 
Comparable, 545 
Complex, 403 
Counter, 436-437 
data types (数据 类 型 )，388 
designing (设计 )，233, 429-431 
Draw, 361 
Graph, 675-679 
Histogram, 392 
implementing (实施 )，231 
In, 354 
libraries( 库 )，29, 230-232 
modular programming (模块 化 编程 )，432 
Out 355 
PathFinder ,683 


Picture, 347 
Queue, 592 

SHE, ,652 

Sketch, 459 

spatial vectors (空间 向 量 )，442-443 
SL G2 
StackOfStrings, 568 
StdArray，237 
StdAudio，159 
StdDraw，149, 154 
StdIn，132-133 
StdOut, 130 
StdRandom，233 
StdStats，244 
StockAccount，410 
Stopwatch, 390 
String, 332-333 
symbol tables (符号 表 )，625-627 
Turtle，394 
Universe，483 
Vector，443 


Approximation algorithms (近似 算法 )，852 
Arbitrary-size input streams (任意 大 小 的 输入 流 )， 


137-138 


args argument (args 参数 )，7, 208 
Arguments ( 实 参 ) 


arrays as (数组 )，207-210 
command-line (命令 行 )，7-8, 11, 127 
constructors (构造 函数 )，333, 385 
methods (方法 )，30 

passing (传递 )，207-210, 364-365 
printf(),，130-132 

static methods (静态 方法 )，197 


Ariane 5 rocket (Ariane 5 运载 火箭 )，35 
Arithmetic (算术 ) 


CPU instructions (CPU 指令 )，1079 

floating point numbers ( 浮 点 数 )，890 

integers (整数 )，884-885 

operators (运算 符 )，22 

TOY machine instructions (TOY 机 器 指令 )，912 


Arithmetic logic units (算术 逻辑 单元 ，ALUs)，1031 


bitwise operations ( 按 位 运算 )，1031 
inputs (输入 )，1031 
outputs (输出)，1032 


summary (总 结 )，1032-1033 
TOY machine (TOY 机 )，910 
Arithmetic expression evaluation (算术 表达 式 计 
算 )，586-589 
Arithmetic shifts (算术 移 位 ) 
bits (位 )，891-892 
purpose (目的 )，898=899 
ArrayIndexOutOfBoundsException, 95, 116, 466 
Arrays (数组) 
aliasing (别名 )，516 
as arguments (作为 参数 )，207-210 
assigning( 赋 值 )，117 
associative (关联 )，630 
binary searches (二 进 制 搜索 )，538-539 
bitonic( 双 调 )，563 
bounds checking (边界 检查 )，95 
comparing (比较 )，117 
coupon collector problem (卡片 收集 问题 )，101-103 
decks of cards (卡片 组 )，97-100 
declaring (声明 )，91, 116 
default initialization (默认 初始 化 ) 93 
exchanging values (交换 值 )，96 
FIFO queues (FIFO 队列 )，596 
hash tables( 散 列表 )，636 
IO libraries (IO 库 )，237-238 
images (图 像 )，346-347 
immutable types (不 可 变 类 型 )，439-440 
iterable classes (可 迭代 的 类 )，603 
linked structures (链接 结构 )，942-944 
machine-language (机 器 语言 )，938-941 
memory (内 存 ),，91, 94, 515-517 
multidimensional (多 维 )，111 
overview (概述 )，90-92 
parallel (平行 )，411 
plotting (绘制 )，246-248 
precomputed values (预先 计算 的 值 )，99-100 
references (引用 )，365 
resizing (可 变 )，578-581, 635 
as return values (作为 返回 值 )，210 
setting values ( 设 定 值 )，95-96 
shuffling ( 混 排 )，97 
side effects (副作用 )，208-210 
Sieve of Eratosthenes ( 埃 拉 托 斯 特 尼 筛 法) 
103-105 
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stacks( 栈 )，568-570; 578-581 
summary (总 结 )，115 
transposition (交换 )，120 
two-dimensional (二 维 的 ) 
Arrays.binarySearch(), 559 
Arrays.sort(), 559 
ArrayStackOfStrings program (程序 ArrayStackOf- 
Strings), 568—570, 603 
Arrival rate in M/M/1 queues( M/M/1 队列 的 到 达 
率 )，597-598 
The Art of Computer Programmingbook (计算 机 编 
程 艺术 )，947 
ASCII standard (ASCII 标准 )，874, 894-895 
Assemblers forTOY machine (TOY 机 的 汇编 )，964 
Assembly language (汇编 语言 ) 
description (描述 )，930 
symbolic names (符号 名 称 )，981 
Assertions (断言 )，466-467 
Assignments〔 赋 值 ) 
arrays (数组 )，117 
chained( 链 式 )，43 
compound (复合 )，60 
description (描述 )，17 
references (引用 )，363 
Associative arrays (关联 数组 )，630 
Associative axiom (结合 律 公理 )，990, 993 
Associativity (结合 律 )，17 
Asterisks ( 星 号 ，*) 
comments (注释 )，9 
floating-point numbers( 浮 点 数 )，24-26 
integers (整数 )，22-23 
regular expressions (正则 表达 式 )，724 
Audio (音频 ) 
plotting sound waves (绘制 音频 波形 )，249 
standard (标准 )，155-159 
superposition ( 合 加 )，211-215 
Autoboxing (自动 装 箱 )，457, 585-586 
Automatic promotion (自动 提升 )，33 
Average-case performance (平均 情况 表现 )，648 
Average magnitude (平均 幅度 )，164 
Average path lengths (平均 路 径 长 度 )，693 
Average power (平均 功率 )，164 
Average program (程序 Average)，137-138 
Axioms in Boolean algebra (布尔 代数 中 的 公理 )，990 
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Backslashes ( 反 斜 枉 ，\) 
escape Sequences ( 转 义 序列 )，19 
regular expressions (正则 表达 式 )，731 
Backward compatibility (向 后 兼容 性 )，976 
Bacon, Kevin ( 凯 文 . 贝 肯 )，684 
Balanced binary trees (平衡 二 又 树 )，661 
Ball animation (小 球 动画 )，152-153 
Barnsley ferns ( 巴 恩 斯 利 蕨 )，240-243 
Base cases(〈 基 础 步骤 ) 
binary search trees (二 分 查找 法 )，640 
recursion (递归 )，264-265, 281 
Base classes( 基 类 )，452-453 
Base64 encoding (Base64 编码 )，904 
Bases in positional notation( 按 位 计数 法 的 基数 )，875 
Basic scaffolding (基础 脚手架 )，302-304 
Basic statistics (基础 统计 )，244-246 
Beck exploit (beck 漏洞 攻击 )，529 
Beckett, Samuel( 塞 缪 尔 . 贝克 特 )，273 
Beckett program (Beckett 程序 )，274-275 
Behavior of objects (对 象 的 行为 )，340 
Benford’s law (本 福 德 定律 )，224 
Bernoulli, Jacob( 雅 各 布 . 伯 努 利 )，398 
Bernoulli program (Bernouli 程序 )，249-250 
Best-case performance (最 佳 表现 ) 
binary search trees (二 叉 搜索 树 )，647 
insertion sort (插入 排序 )，544 
Big-O notation (大 O 表示 法 )，520-521 
BigInteger class (BigInteger 类 )，827, 897-898 
Binary adders (二 进 制 加 法 器 )，771 
Binary digits (二 进 制 数字 )，22 
Binary frequency count equality (二 进 制 频率 计数 
相等 )，772-773 
Binary incrementers (二 进 制 增 量 器 )，769-771 
Binary number system (二 进 制 系统 ) 
conversions (转换 )，67-69 
description (描述 )，38 
Binary operators (二 元 操作 符 )，17 
Binary program (Binary 程序 )，67-69 
Binary reflected Gray code( 二进制 表示 的 格雷 码 )， 
274 
Binary representation (二 进 制 表 示 ) 
decimal conversions (十 进 制 转换 )，877 


description (描述 )，875 
examples (示例 )，878--879 
hex conversions (十 六 进 制 转换 )，876-877 
literals (常量 )，891 
Binary search trees (二 叉 搜索 树 ，BSTs) 
implementation (实现 )，645-646 
insert process (插入 过 程 )，644-645 
machine-language (机 器 语言 )，942-944 
ordered operations (与 顺序 相关 的 操作 )，651 
overview (概述 )，640-643 
performance (性 能 )，647-648 
search process (搜索 过 程 )，643-644 
symbol tables (符号 表 )，624-625 
traversing (遍历 )，649-650 
Binary searches (二 分 查找 ) 
binary representation (二 进 制 表 示 )，536 
correctness proof (算法 正确 性 证 明 )，535 
exception filters (异常 过 滤器 )，540 
inverting functions( 求 反 函 数 )，536-538 
overview (概述 )，533-534 
random web surfer (随机 网 上 冲浪 )，176 
running time (运行 时 间 )，535 
sorted arrays (排序 数组 )，538-539 
symbol tables (符号 表 )，635 
weighing objects (物体 称 重 法 )，540-541 
Binary strings (二 进 制 字符 串 )，718-719 
Binary trees (二 又 树 ) 
balanced (平衡 )，661 
heap-ordered( 堆 排序 )，661 
isomorphic( 同 构 )，661 
Binary16 format (Binary 16 格式 )，888 
BinarySearch program (程序 BinarySearch)，538- 
539 
Binomial coefficients (二 项 式 系数 )，125 
Binomial distributions (二 项 式 分 布 )，125, 249 
Biology (生物 学 ) 
computational (计算 )，732-734 
DNA computers (DNA 计算 机 )，795 
genomics application (基因 组 学 应 用 ) 336-340 
graphs (图 谱 )，672 
Bipartite graphs (二 分 图 )，682 
Bisection searches (二 分 搜索 )，537 
Bit-slice memory design (位 片 内 存 设计 )，1054- 
1056 


Bitmapped images (位 图 图 像 )，346 
Bitonic arrays( 双 调 数 组 )，563 
Bits (位 ) 
binary number system (二 进 制 系统 )，38, 875 
bitwise operations( 按 位 运算 )，891-892 
computer dependence (计算 机 依赖 )，874 
description (描述 )，22 
logical instructions (逻辑 指令 )，912-913 
manipulating (操作 )，891-893 
memory (内 存 )，1056 
memory size (内 存 大 小 )，513 
register (寄存 器 )，1051 
shifting ( 移 位 )，891-892 
Bitwise operations ( 按 位 运算 ) 
and (与 )，913 
arithmetic logic units〈 算 术 逻 辑 单元 )，1031 
exclusive or ( 异 或 )，39, 913 
shift ( 移 位 )，913 
Black-Scholes formula (布莱克 - 斯 克 尔 斯 期 权 估 
价 公式 ); 222, 565 
Blobs, 709 
Blocks ( 块 ) 
statements (语句 )，50 
variable scope (变量 作用 域 )，200 
Bodies ( 体 ) 
loops (循环 )，53 
static methods (静态 方法 )，196 
Body program (程序 Body) 
memory (内 存 )，514 
N-body simulation (多 体 模拟 )，479-482 
Bolloba s-Chung graph model (Bolloba s-Chung 
图 模型 )，713 
Book indexes (本 书 索引 )，632-633 
Booksite (本 书 官 网 )，2-3 
Boole, George (布尔 .乔治 )，986 
boolean data type (布尔 数据 类 型 ) 
conversion codes (转换 代码)，131-132 
description (描述 )，14-15 
input (输入 )，133 
memory size (内 存 大 小 )，513 
overview (概述 )，26-27 
Boolean logic (布尔 逻辑 ) 
cryptography application (密码 学 应 用 )，992- 
994 
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description (描述 )，27 
expressions (表达 式 )，995-996 
functions (函数 )，987-991, 994-997 
overview (概述 )，986 
Boolean matrices (布尔 矩阵 )，302 
Boolean satisfiability (布尔 可 满足 性 )，832, 836 
boolean equation satisfiability problem (布尔 方 
程 可 满足 性 问题 )，838 
NP-completeness ( NP 完全 性 )，844=846, 853-- 
856 
Booting (启动 )，959-960, 968-969 
Bootstrapping (步步为营 法 )，971 
BouncingBall program ( 程 序 BouncingBall )，152- 
153 
Bounding boxes for drawings (绘图 的 边界 框 )，146 
Bounds (边界 ) 
arrays( 数 组)，95 
exponential time (指数 时 间 )，826 
polynomial time (多 项 式 时 间 )，825 
Boxing ( 装 箱 )，457, 585-586 
Box-Muller formula (Box-Muller 公式 )，47 
Breadth-first searches (广度 优先 算法 )，683,687= 
688, 690, 692 
break statement (break 语句 )，74 
Bridges, Brownian (布朗 桥 )，278-280 
Brin, Sergey ( 谢 尔 盖 … 布 林 )，184 
Brown, Robert (罗伯特 布衣 )，400 
Brownian bridges (布朗 桥 )，278-280 
Brownian motion (布朗 运动 )，400-401 
Brownian program (Brownian 程序 )，278-280 
Brute-force algorithm (暴力 算法 )，535-536 
BST program (程序 BST)，645-646 
BSTs 
Buffer overflow( 缓 冲 区 溢出 ) 
arrays( 数 组)，95 
attacks (攻击 )，963 
Buffering drawings (绘图 缓冲 区 )，151 
Bugs (错误 ) 
aliasing (别名 ) 363, 439, 441 
overview (概述 )，6 
testing for (测试 )，318 
Built-in data types (内 置 数据 类 型 ) 
boolean (布尔 数据 类 型 )，26-27 
characters and strings (字符 和 字符 串 )，19-21 
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comparisons (比较 )，27-29 

conversions (转换 )，32-35 

floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22-24 

library methods( 库 方法 )，29-32 overview, 14-15 
summary (总 结 )，35-36 

terminology (术语 )，15-18 

Built-in interfaces (内 置 接口 )，451 


Buses (总 线 )，1034-1036 


CPU connections (CPU 连接 )，1077 
program counter connections (程序 计 数 器 连接 )， 
1073-1074 
Buzzers( 蜂 鸣 器 )，1048 
byte data type ( 字 节 数据 类 型 )，24 
Bytecode ( 字 节 码 ) 
compiling (编译 )，589, 788 
Java virtual machine (Java 虚拟 机 )，965 
Bytes memory size( 字 节 内 存 大 小 ),513 
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C conversion specification (C 转化 规范 )，131 
Caches (缓存 ) 
and instruction time (指令 时 间 )，509 
in top-down dynamic programming ( 自 上 而 下 动 
态 编程 )，284 
Calculators (计算 器 )，908 
Callbacks in event-based programming (基于 事 
件 编程 的 回溯 )，451 
Calls (调用 )，193 
chaining (链接 )，404 
in machine language (使 用 机 器 语言 )，932-933 
methods (方法 )，30, 197, 340 
reverse Polish notation( 反 向 波兰 表示 法 )，591 
Canvas (画布 )，151 
Card decks, arrays for (扑克 牌 ， 数 组 )，97-100 
Carets( 脱 字符 运算 ^) 
bitwise operations ( 按 位 运算 )，891-892 
regular expressions (正则 表达 式 )，731 
Carroll, Lewis (刘易斯 * 卡 罗 尔 )，710 
Carry bits in adders (加 法 器 中 进位 )，1028 
Cartesian representation( 笛 卡 儿 表示 )，433 
Casts (转型 )，33-34 
Cat program (cat 程序 )，356 
Cellular automata (元 胞 自动 机 );，794 


Central processing units (中 央 处 理 器 ，CPUs) 
bus connections (总 线 连接 )，1077 
control lines (控制 线 )，1077-1078 
execute phase( 执 行 阶段 ), "1079 
fetch phase( 取 指 阶 段 )，1078 
instructions (说 明 )，1079-1080 
interfaces (接口 )，1076 
load address (加 载 地 址 )，1080 
modules (模块 )，1076 
overview (概述 )，985 
TOY-8 machine (TOY-8 机 )，1076-1080 

Centroids (质心 )，164 

Chained assignments( 链 式 赋 值 )，43 

Chained comparisons( 链 式 比较 )，43 

Chaining method calls ( 链 式 方 法 调用 )，404 
Characters and char data type( 字 符 与 字符 串 类 型 ) 

ASCII (ASCII 编码 )，894 

conversion to numbers (转换 为 数字 )，880-881 

description (描述 )，15 

memory size (内 存 大 小 )，513 

representing (表示 )，894-895 

Unicode, 894-—895 

working with (协作 )，19-21 

Charge program (程序 Charge)，383-389, 515 
Checksums ( 校 验 和 ) 
description (描述 )，86 
formula (公式 ),，220 
Chords (和 弦 )，211 
Chromatic scale( 半 音阶), 156 
Church, Alonso( 阿 隆 索 . 印 奇 )，790 
Church-Turing thesis ( 印 奇 - 图 灵 论 题 ) 
extended (扩展 )，823 
overview (概述 )，790-791 
Turing machine simalation (图 灵机 模型 )，798 
virtual machines (虚拟 机 )，958 
Ciphers, Kamasutra (Kamasutra 密码 )，377 
Ciphertext ( 密 文 )，993 
Circuit models (电路 模型 ) 
building circuits (构建 电路 )，1006-1008 
connections (连接 )，1002-1004 
controlled switches (控制 开关 )，1005=1006 
conventions (惯例 )，1004 
inputs (输入 )，1002-1004 
logical design (逻辑 设计 )，1008-1009 


outputs (输出 )，1002-1004 
overview (概述 )，1002-1003 
wires (导线 )，1002-1004 
Circuits (电路 ) 
combinational (组 合 电路 ) 
description (描述 )，1010 
from gates ( 门 ),，1019-1021 
memory (内存 )，1054-1057 
Circular linked lists (循环 链表 )，622 
Circular queues (循环 队列 )，620 
Circular shifts (循环 位 移 )，375 
.class extension (.class 扩展 )，3, 8, 228 
ClassDefFoundError, 160 
Classes (类 ),，4-5 
accessing (访问 )，227-229 
description (描述 )，226 
implementing (实现 )，383-389 
inner (内 部 )，609 
modules as( 建 模 为 )，228 
variables (变量 )，284 
Classifying NP-complete problems ( NP 完全 问题 
分 析 )，851 
Client code (客户 端 代码 ) 
data types (数据 类 型 )，430 
library methods( 库 方法 )，230 
Clocks (时 钟 ) 
CPU (中 央 处 理 器 )，1077-1079 
fetch and execute ( 取 指 并 执行 ) 1059, 1061 
overview (概述 )，1058-1059 
run and halt inputs (运行 并 停止 输入 )，1060 
write control ( 写 人 控制 )，1059-1060 
Closure operation in REs (RE 中 的 闭 包 操作 )， 
724 
Clouds, plasma (等 离子 体 云 )，280 
Clustering coefficients ( 聚 类 系数 ) 
global (全 局 )，713 
local (局 部 )，693-694 
CMYK color format (CMYK 颜色 格式 )，48-49， 
371 
Code and coding (代码 与 编程 ) 
description (描述 )，2 
encapsulating (封装 )，438 
incremental development ( 增 量 开发 )，319,701 
reuse ( 复 用 )，226, 253, 701 
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static methods (静态 方法 )，205-206 


Codebooks (密码 本 )，992 


Codons (密码 子 )，genes (基因 ),-336 
Coefficients for floating-pointnumbers ( 浮 点 数 
的 系数 )，889 


Coercion (强制 转 换 )，33 


Coin flip〈 抛 掷 硬币 )，52-53 
Collatz function〈 克 拉 茨 函数 )，784 
Collatz problem (克拉 茨 问 题 )，296-297, 818 
Collatz sequence【〈 克 拉 茨 序列 )，948 
Collections (集合 ) 

description (描述 ); 566 

iterable (可 迭代 )，601-605 

objects (对 象 )，582-583 

queues (队列 ) 

stacks ( 栈 ) 

symbol tables (符号 表 ) 


Colons (冒号 ) 


in Turing machine tapes (在 图 灵机 纸 带 中 ) 767 
foreach statements (foreach 语句 )，601-602 


Color and Color data type (颜色 和 Color 数据 类 型 ) 


blobs, 709 

compatibility (兼容 性 )，344 
conversion 《转换 )，48-49 
drawings (绘图 )，150 
grayscale( 灰 度 )，344 
luminance (亮度 )，343 
memory (内 存 )，514 
overview (概述 )，341-343 


Columns in 2D arrays (三 维 数组 中 的 列 )，106， 


108 


Combinational circuits (组 合 电路 ) 


adders (加 法 器 )，1028-1030 

ALUs (算术 逻辑 单元 )，1031-1033 
buses (总 线 )，1034-1036 

decoders (解码 器 )，1021-1022 
demultiplexers (多 路 分 配器 ),; 1022 
description (描述 )，1007-1008 

gates ( 门 )，1013-1021 

layers of abstraction (抽象 层 )，1037=1039 
modules (模块 )，1034 

multiplexers (多 路 复 用 器 )，1023 
overview (概述 )，1012 
sum-of-products( 积 之 和 )，1024-1027 
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Comma-separated-value ( .csv) files (逗号 分 隔 值 
文件 )，358, 360 
Command-line arguments (命令 行 参数 )，7-8, 11， 
127 
Commas (逗号 ) 
arguments (参数 )，30 
constructors (构造 明 数 )，333 
lambda expressions (Lambda 表达 式 )，450 
methods (方法 )，30, 196 
two-dimensional arrays (二 维 数组 )，108 
Comments (注释 )，5,9 
Commercial data processing (商业 数据 处 理 )， 
410-413 
Common sequences (常见 序列 ),longest (最 长 )， 
285—288 
Commutative axiom (交换 律 公理 )，990 
Compact trace format (紧凑 的 跟踪 格式 )，770 
Comparable interface (可 比较 接口 )，451, 545 
Comparable keys( 可 比较 键 ) 
sorting (排序 )，546 
symbol tables (符号 表 )，626-627 
CompareDocuments program (程序 Compare- 
Documents), 462-463 
compareTo() method (compareTo() 方法 ) 
description (描述 )，451 
String (字符 串 )，332 
user defined (用 户 定义 )，545-546 
Comparisons arrays (可 比较 数组 )，117 
chained ( 链 式 )，43 
objects (对 象 )，364, 545-546 
operators (运算 符 )，27-29 
performance (性 能 )，508-509 
sketches (文档 摘要 )，462-463 
Compatibility (兼容 性 ) 
backward (向 后 )，976 
Color (Color 类 型 )，344 
Compile-time errors (编译 时 错误 )，6 
Compilers (编译 器 ) 
description (描述 )，3, 589 
optimizing (优化 )，814 
programs as data (程序 作为 数据 )，922-924 
purpose (目的 )，788 
TOY machine (TOY 机 )，964-965 
Compiling (编译 ) 


array values set at (数组 值 设置 为 )，95-96, 108 
classes in (类 )，229 
description (描述 )，2 
programs (程序 )，3 
Complement operation (补充 操作 ) 
bitwise( 按 位 )，891 
Boolean algebra (布尔 代数 )，990 
Complete small-world graphs (完成 小 世界 图 )， 
694 
Complex program (程序 Complex) 
chaining method calls ( 链 式 方 法 调用 )，404 
encapsulation (封装 )，433-434 
instance variables (实例 变量 )，403-404 
objects (对 象 )，404 
overview (概述 )，402-403 
program (程序 )，405 
Complex numbers (复数 )，406-409 
Compound assignments (组 合 赋值 )，60 
Compression (压缩 )，optimal (最 优 )，814 
Computability (可 计算 ) 
algorithms (算法 )，787 
halting problem (停机 问题 )，808-810 
Hilbert's program ( 希 尔 伯 特 计划 )，806-807 
liar"s paradox (说 谎 者 悖 论 )，807-808 
overview (概述 ) 806 
reduction( 归 约 )，811-813 
unsolvability proof (不 可 证 明 的 证 明 )，810 
unsolvable problems (不 可 解 问题 ) 
Computation: Finite and Infinite (计算 : 有 限 机 和 
无 限 机 )，780 
Computational biology (计算 生物 学 )，732-734 
Computational models (计算 模型 )，716 
Computer animations (计算 机 动画 )，151 
Computer speed in performance (计算 速度 的 性 能 
表现 )，507-508 
Compnuter systems (计算 机 系统 )，1094-1095 
Computers and Intractability A Guide to the Theory 
of NP Completeness book (计算 机 与 难 解 问 
题 : NP 完全 性 理论 指南 )，859 
Computers Ltd: What They Really can’t Do book ( 计 
算 机 的 极限 : 它们 真正 不 能 办 到 的 事 )，780 
Computing devices (计算 设备 ) 
boolean logic (布尔 逻辑 ) 
circuit models (电路 模型 ) 


combinational circuits (组 合 电路 ) 
digital (数字 ) 

overview (概述 )，985 

sequential circuits (时 序 电路 ) 

Computing machines (计算 机 器 ) 
machine-language programming (机 器 语言 编程 ) 
overview (概述 )，873 
representing information (表示 信息 ) 

TOY (TOY 机 ) 

Computing sketches (计算 草图 )，459-460 

Concatenation (拼接 ) 
files (文件 )，356 
strings (字符 串 )，19-20, 723-724 

Concert A, 155 

Concordances (词汇 索引 )，659 

Conditionals and loops( 条 件 和 循环 )，50 
applications (应 用 )，64-73 
break statement (break 语句 )，74 
continue statement (continue 语句 )，74 
do-while loops (do-while 循环 )，75 
examples (示例 )，61 
for loops (for 循环 )，59-61 
if statement (站 语句 ),，50-53 
infinite loops( 死 循环 )，76 
miscellaneous (杂项 )，74-75 
in modular programming (在 模块 化 编程 中 )， 

227-228 
nesting (能 套 )，62-64 
performance analysis( 性 能 分 析 )，500, 510 
static methods (静态 方法 );，193-195 
summary (总 结 )，77 
switch statement (switch 语句 )，74--75 
TOY machine (TOY 机 )，913, 918-921 
while loops (while 循环 )，53-59 

Connected components (连接 组 件 )，709 

Connecting programs (连接 程序 )，141 

Connections (连接 ) 
buses (总 线 )，1034 
circuit models (电路 模型 )，1002-1004 
CPU (中 央 处 理 器 )，1077 
power source (电源 )，1003-1004 
program counters (程序 计数 器 )，1073-1075 

Constant order of growth (常量 增长 量 级 )，503 

Constants (常量 )，16 
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Constructors (构造 函数 ) 
data types (数据 类 型 )，384-385 
String (字符 串 )，333 
Containing symbol table keys (包含 符号 表 键 )， 
624 
Context-free languages (无 上 下 文 的 语言 )，755 
Continue statements (continue 语句 )，74 
Contracts (契约 ) 
APIs (应 用 程序 编程 接口 ) 230-231 
design by contract (契约 式 设 计 )，465=-467 
interface (接口 )，446-447 
machine-language (机 器 语言 )，932 
Control characters (控制 字符 )，894 
Control circuit (控制 电路 ) 
CPU (中 央 处 理 器 )，1078 
execute signals (执行 信 号 )，1082-1083 
fetch signals( 取 指 信号 )，1080, 1082-1083 
overview (概述 )，1080 
Control flow (控制 流程 ) 
conditionals and loops (条件 和 循环 ) 
static method calls (静态 方法 调用 )，193=195 
Control lines (控制 线 ) 
CPU (中 央 处 理 器 )，1077-1080 
memory bits (内存 位 )，1056 
multiplexers (多 路 复 用 器 )，1019=1020 
program counters (程序 计数 器 )，1074-1075 
register bits (寄存 器 位 )，1051 
Controlled switches ( 控 制 开 关 )，1002-1003， 
1005-1006 
Conversion codes (转换 代码 )，131-132 
Conversion specifications (转换 规范 )，130-131 
Conversions (转换 ) 
casts (转型 )，33-34 
color (颜色 )，48-49 
data types (数据 类 型 )，339 
decimal to binary (十 进 制 转 二 进 制 )，877 
explicit ( 显 式 地 )，34-35 
hex and binary (十 六 进 制 和 二 进 制 )，876-877 
implicit( 隐 式 地 )，33 
numbers (数字 )，21, 67-69 
overview (概述 )，32 
strings 字符 串 )，21, 453, 880-881 
Convert program (程序 Convert),880-882 
Conway, John (约翰 . 康 威 )，326, 794 
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Cook, Stephen,( 库 克 … 史蒂芬 ) 840, 845 
Cook-Levin theorem ( 库 克 * 莱 维 定理 )，844- 
845, 847 
Cook reduction ( 库 克 归 约 )，841 
Coordinates (坐标 ) 
drawing (绘图 )，144-146 
images (图 像 )，347 
polar( 极 )，47 
Corner cases (边界 条 件 )，236 
Cosine similarity measure (余弦 相似 性 度量 法 )，462 
Cost of immutable types (不 可 变 类 型 的 代价 )， 
440 
Coulomb's law (库仑 定律 ) 383 
Counter circuits (计数 器 电路 )，1008 
Counter machines (计数 器 )，794 
Counter program (计数 程序 )，436-437 
Coupon collector problem ( 卡 券 收集 问题 )，101- 
103 
Coupon program (程序 Coupon)，206 
CouponCollector program( 程 序 CouponCollector)， 
101=103, 205 
CPUs (中 央 处 理 器 ) 
Craps game( 措 骨 子 游戏 )，259 
Cray, Seymour( 西 摩 * 格雷 )，971 
Crichton, Michael (迈克 尔 ， 克 莱 顿 )，424 
Cross-coupled NOR gates (交叉 耦合 或 非 门 )，1050 
Cross-coupled switches (交叉 耦合 开关 )，1049 
Cross products of vectors (向 量 交叉 乘积 )，472 
Cryptographic keys (加密 密 钥 )，992 
Cryptography application (密码 学 应 用 )，992-994 
Cryptosystems (加 密 系统 )，992-993 
<Ctrl-C> keys (<Ctrl-C> 键 ),76 
<Ctrl-D> keys (<Ctrl-D> 键 ) -137 
<Ctrl-Z> keys (<Ctrl-Z> 键 )，137 
Cubic order of growth (三 次 型 增长 量 级 )，505- 
508 
Cumulative distribution function (累计 分 布 函 数 )， 
202-203 
Curly braces ({}) 
regular expressions (正则 表达 式 )，724, 731 
statements (语句 )，5, 78-79 
static methods (静态 方法 )，196 
two-dimensional arrays (二 维 数组 ), 108 
Curves (曲线 ) 


Brownian bridges (布朗 桥 )，278-280 
Dragon ( 龙 形 )，49, 424 
Koch ( 科 赫 )，397 
space-filling (空间 填充 )，425 
spirals (螺旋 )，398-399 
Cycles per second (每 秒 周期 数 )，155 
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Dantzig, George (乔治 . 丹 齐 格 )，831 
Data abstraction (数据 抽象 )，329, 382 
Data as instructions (数据 作为 指令 )，922-924 
Data compression (数据 压缩 )，814 
Data-driven code (数据 驱动 代码 )，141, 171, 184 
Data mining example (数据 挖掘 示例 )，458-459 
Data paths for buses (总 线 数据 路 径 )，1034 
Data structures (数据 结构 )，493 
arrays( 数 组) 
binary search trees (二 又 搜索 树 ) 
linked lists (链表 )，571-578 
queues (队列 ) 
resource allocation (资源 分 配 )，606-607 
stacks( 栈 ) 
stock example (股票 示例 )，411 
summary (总 结 )，608 
symbol tables (符号 表 ) 
Data-type design (数据 类 型 设计 ) 
APIs (应 用 程序 编程 接口 )，429-43 
data mining example (数据 挖掘 示例 )，458-464 
design by contract ( 按 契 约 设计 )，465-467 
encapsulation (封装 )，432-438 
immutability (不 可 变 )，439-446 
subclassing ( 子 类 化 ) 452-457 
subtyping ( 子 类 型 化 )，446-45 
overview (概述 )，428 
Data types (数据 类 型 ) 
access modifiers (访问 修饰 符 )，38 
APIs (应 用 程序 编程 接口 )，38 
boolean, 99 
built-in (内 置 )，38 
Color, 341-34 
Complex, 402-405 
constructors (构造 函数 )，384-385 
conversions (转换 )，34-35, 339 
creating (创建 )，38 


definitions (定义 )，331-335 
DrunkenTurtle, 400-401 
elements summary (要 素 摘要 )，383 
generic (通用 )，583-58 
Histogram, 392-39 
image processing (图 像 处 理 )，346-352 
immutable (不 可 变 )，364, 43 
input and output (输入 和 输出 )，353-362 
insertion sorts (插入 排序 )，545-548 
instance methods (实例 方法 )，385-386 
instance variables (实例 变量 )，384 
Koch, 397 
Mandelbrot, 406-409 
output (输出 )，355 
overview (概述 )，330 
reference (引用 )，362-369 
Spiral; 398-399 
StockAccount, 410-413 
Stopwatch，390-391 
String 
summary (总 结 )，368 
TOY machine (TOY 机 )，907 
Turtle，394-396 
type safety (类 型 安全 )，18 
variables within methods (方法 中 的 变量 )，386- 
388 
Data visualization (数据 可 视 化 )，307-309 
Davis, Martin (马丁 … 戴 维 斯 )，816 
Dead Sea Scrolls (死海 十 卷 )，659 
Debugging (调试 ) 
abstraction layers (抽象 层 )，1037 
assertions (断言 ) 466-467 
encapsulation for (封装 ), 432 
immutable types (不 可 变 类 型 )，440 
incremental ( 增 量 )，317, 319 
linked lists (链表 )，596 
modular programming (模块 化 编程 ) 251-254 
test client main() for (测试 客户 端 main())，235 
unit testing (单元 测试 )，246 
Decidability (可 判定 性 )，786-787 
Decimal number system (十 进 制 系统 ) 
conversion to binary (转化 为 二 进 制 )，877 
description (描述 )，38, 875 
examples (示例 )，878-879 
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Decision problems (决策 问题 )，NP, 835 
Decks of cards (一 副 扑 克 )，97-100 
Declaration statements (声明 语句 )，15-16 
Declaring (声明 ) 
arrays (数组 )，91, 116 
String variables (字符 串 变量 )，333 
Decoders (解码 器 )，1021-1022 
Decoding numbers (解码 数字 )，889 
Decrementers (递减 器 )，binary (二 进 制 )，770-771 
Decryption devices (解密 设备 )，992 
Dedup operation (除尘 操作 ) 
punched paper tape (穿孔 纸 带 )，942-944 
strings (字符 串 )，652-653 
DeDup program (程序 DeDup)，652-653 
Default values (默认 值 ) 
arrays (数组 )，93, 106-107 
canvas size (画布 尺寸 )，145 
ink color (油墨 颜色 )，150 
instance variables (实例 变量 )，415 
Node objects (Node 对 象 )，572 
pen radius( 笔 半径 )，146 
Defensive copies (防御 拷贝 )，441 
Defining (定义 ) 
functions (函数 )，192 
interfaces (接口 )，446 
static methods (静态 方法 )，193, 196 
Definite integration ( 定 积分 )，816 
Degrees of separation (分 隔 度 ) 
description (描述 )，670 
shortest paths (最 短路 径 )，684--686 
DeMorgan's laws ( 德 摩根 定律 )， 989-991， 
1014-1015 
Demultiplexers (多 路 分 配器 )，1022 
Denial-of-service attacks (拒绝 服务 攻击 )，512 
Dependencies in subclasses ( 子 类 中 的 依赖 关系 )， 
453 
Dependency graphs (依赖 图 )，252 
Deprecated methods (不 推荐 使 用 的 方法 )，469 
Depth-first searches (深度 优先 搜索 算法 ) 
Vs. breadth-first searches (广度 优先 搜索 算法 )， 
690 
percolation case study (渗透 案例 研究 )，312 
Deques〔 双 端 队 列 )，618 
Derived classes (派生 类 )，452 
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Descartes, René ( 勒 内 : 笛 卡 儿 )，398 
Design (设计 ) 
APIs( 应 用 程序 编程 接口 )，233 
by contract (按照 契约 )，465-467 
data types (数据 类 型 ) 
Deterministic finite-state automata ( DFAs) (确定 有 
限 状 态 自 动机 ) 
examples〈 示 例 )，740-741 
implementation (实施 )，741-743 
Kleene’s theorem ( 克 林 定 理 ) 
language recognized (识别 的 语言 )，739-740 
NFA equivalence (NFA 等 价 )) 749-750 
nondeterminism (〈 非 确定 性 )，744-748 
operations (操作 符 )，739 
overview (概述 )，738 
power limitations (功率 限制 )，753-755 
summary (总 结 )，756 
universal virtual (通用 虚拟 )，788-789 
DFA program (程序 DFA )，742-743 
Diameters of graphs (图 的 直径 )，711 
Diamond operators (<>)( 钻 石 运 算 符 )，585 
Dice ( 般 子 ) 
Sicherman 〈 塞 克文 山子 )，259 
simulation (模拟 )，121 
Dictionary lookup〈 字 典 查找 )，624, 628-632 
Difficult problems (困难 问题 ) 
intractability (难以 处 理 )，828-829 
search problems (搜索 问题 )，837-838 
Digital circuits (数字 电路 )，1013 
Digital devices (数字 设备 )，1070 
control (控制 )，1080-1082 
CPU (中 央 处 理 器 )，1076-1080 
program counters (程序 计数 器 )，1073=1075 
Digital image processing (数字 图 像 处 理 ) 
digital images (数字 图 像 )，346-347 
fade effect( 淡 入 淡出 效果 )，351-352 
grayscale( 灰 度 )，347-349 
overview (概述 )，346 
scaling (缩放 )，349-350 
Digital signal processing (数字 信号 处 理 )，155， 
158 
Dijkstra, Edsgar ( 埃 德 加 迪克 斯 特 拉 ) 
Dutch-national-flag problem (荷兰 国旗 问题 )， 
564 


goto statements (goto 语句 )，926 
two-stack algorithm ( 双 栈 算法 )，587 
Dijkstra’s algorithm (Dijkstra 算法 )，692 
Diophantine〈 丢 番 图 )，816 
Directed graphs (有 向 图 )，711 
Directed percolation (有 向 渗透 原理 ), 317 
Discrete distributions (离散 分 布 )，172 
Disjunctive normal forms ( 析 取 范式 )，996-997 
Distances of graph paths (图 路径: 的 距离 )， 
683,687-688 
Distributive axiom (分配 律 公理 ),，990 
Divide-and-conquer approach (分 治 策略 ) 
linearithmic order of growth (线性 增长 顺序 )， 
504 
mergesort (归并 排序 算法 )，550-551, 554 
Division( 除 法 ) 
floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22-23 
polar representation 〈 极 坐标 表示 )，433 
DivisorPattern program ( 程 序 DivisorPattern )， 
62—64 
DNA computers (DNA 计算 机 )，795 
DNS (domain name system)( 域 名 系统 )，629 
do-while loops (do-while 循环 )，75 
Documents, searching for (文档 搜索 )，464 
Dollar signs ($) in Res( 正 则 表达 式 中 的 $ 符 号 )， 
731 
Domain name system (DNS)( 域 名 系统 )，629 
Domains, function (域名 函数 )，192 
Dot products (点 积 ) 
function implementation (函数 实现 )，209 
vectors (向 量 )，92, 442-443 
Double.parseDouble() method ( Double.parseDouble() 
calls to( 调 用 )，30-31 
type conversion (类 型 转换 )，21, 34 
Double buffering drawings( 双 缓冲 绘图 )，151 
double data type (double 数据 类 型 ) 
conversion codes (转换 代码 )，132 
description (描述 )，14-15 
input (输入 )，133 
memory size (内 存 大 小 )，513 
overview( 概 述 )，24-26 
Double negation identity (双重 否定 等 式 ),，990 


Double negatives in gates (双重 否定 门 )，1015- 
1016 
Double quotes("")( 双 引号 ) 
escape sequences ( 转 义 序列 )，19 
text (文本 )，5, 10 
Doublet game ( 偶 极 子 游戏 )，710 
Doubling hypotheses (倍增 假说 )，496, 498-499 
DoublingTest program (程序 DoublingTest)，496， 
498-499 
Downscaling in image processing (缩小 图 像 处 理 )， 
349 
Dragon curves( 龙 形 曲 线 )，49, 424 
Dragon program (程序 Dragon)，163 
Draw library (画图 库 )，361 
Drawings (绘图 ) 
recursive graphics (递归 图 形 )，276-277 
standard (标准 ) 
DrunkenTurtle program (程序 DrunkenTurtle)，400 
DrunkenTurtles program (程序 DrunkenTurtles)，401 
Dumping virtual machines( 转 储 虚 拟 机 ), 960=961 
Dutch-national-flag problem (荷兰 国旗 问题 )，564 
Dynamic dictionaries (动态 词典 )，628 
Dynamic dispatch (动态 调度 )，448 
Dynamic programming (动态 编程 ) 
bottom-up( 自 下 而 上 )，285 
longest common subsequence( 最 常见 的 子 序列 )， 
285-288 
overview (概述 )，284 
summary (总 结 )，289 
top-down ( 自 顶 向 下 )，284 


E 


Easy problems (简单 问题 ) 

intractability《〈 难 处 理性 )，829 

search (搜索 )，837 
Eavesdroppers (窃听 者 )，992-993 
Eccentricity in vertices (顶点 的 偏心 距 )，711 
Eckert, J. Presper( 普 雷 斯 伯 … 埃 克 特 )，924-925 
Edges ( 边 ) 

graphs (图 )，671, 674 

self-loops and parallel ( 自 循 环 和 平行 )，676 
EDVAC computer (EDVAC 计算 机 )，924-925 
Efficiency (效率 ) 

n-body simulation (多 体 模 拟 )，488 
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random web surfer (随机 网 络 冲 浪 )，185 
Turing machines (图 灵机 )，772 
Efficient algorithms (有 效 算法 )，532 
Einstein, Albert (阿尔 伯 特 . 爱 因 斯 坦 )，400 
Election voting machine errors (选举 投票 机 错误 )， 
436 
Electric charge (电荷 )，383-389 
Element distinctness problem (元 素 不 同性 问题 )， 
554 
Elements in arrays〈 数 组 中 的 元 素 )，90 
else clauses (else 子 句 )，51-52 
Empirical analyses (实证 分 析 )，496-497 
Empty strings with REs ( 带 有 正则 表达 式 的 空 字 
符 串 )，724 
Emulators (仿真 器 )，965 
Encapsulation (封装 ) 
code clarity (代码 简洁 性 )，438 
error prevention (错误 预防 )，436-437 
example (示例 )，433-434 
modular programming (模块 化 编程 )，432 
overview (概述 )，432 
planning for future (未 来 规划 )，435 
private access modifier (私有 访问 修饰 符 )，433 
Encoding numbers (编码 )，889 
Encryption devices (加 密 设备 )，992 
End-of-file sequence (文件 结束 序列 )，137 
Enhancements for Turing machines (图 灵机 的 增强 
功能 )，792-=793 
ENIAC computer (ENIAC 计算 机 )，924-925 
Enigma code ( 英 格 玛 密码 )，717 
Entropy ( 业 ) 
Shannon (香农 )，378 
text corpus (文本 语料库 )，667-668 
Equals signs (=) 
assignment statements (赋值 语句 )，17 
assignment vs. boolean (赋值 与 布尔 值 )，42, 78 
comparisons (比较 )，27-29, 364 
compound assignments (组 合 赋值 )，60 
Vs. equals() (与 equals() 比较 )，369-370 
Equality of objects (对 象 相 等 性 )，364, 454-456 
equals() method (equals() 方法 ) 
Color (颜色 )，343 
Vs. equals signs (等 号 )，369-370 
Object (对 象 )，453-455 
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String (字符 串 )，332 
Equilateral triangles (等 边 三 角形 ), -144=145 
Equivalence problem for Res (正则 表达 式 等 价 问 
题 ) 728 
Equivalent models for Turingmachines (图 灵机 的 
等 效 模型 )，792-793 
Erdos, Paul, 686 
Erd6s-Renyi model ( Erd5s-Renyi 图 模型 )，695， 
12 
Errors (错误 ) 
aliasing (别名 )，363 
debugging (调试 ) 
encapsulation for (封装 )，436-437 
overview (概述 )，6 
syntax( 语 法 )，10-11 
testing for (测试 )，318 
Escape characters( 转 义 字 符 )，730, 757 
Escape sequences( 转 义 序列 )，19 
Euclidean distance( 欧 氏 距 离 ) 
sketch comparisons (摘要 比较 )，462-463 
vectors( 问 量 )，118 
Euclid’s algorithm( 欧 几 里 得 算法 ) 
description (描述 )，85 
machine-language (机 器 语言 ) 931 
recursion (递归 )，267-268 
TOY machine (TOY 机 )，918-921 
Euler Leonhard ( 莱 昂 哈 德 . 欧 拉 )，89 
Euler’s constant ( 欧 拉 常数 )，222 
Euler's sum-of-powers conjecture ( 欧 拉 寡 之 和 猜 
想 ),89 
Euler’s totient function( 欧 拉 函 数 )，222 
Evaluate program ( 求 值 程序 )，588-589 
Evaluating expressions ( 求 值 表达 式 )，17, 586- 
589 
Event-based programming (基于 事件 的 编程 )， 
451 
Exception class (异常 类 )，465 
Exception filters (异常 过 滤器 )，540 
Exceptions (异常 )，465-467 
Exchanging values (交换 值 ) 
arrays (数组 )，96 
function implementation (函数 实现 )，209 
Exclamation points (!) 
not operator ( 否 操作 符 )，26-27, 991 


comparisons (比较 )，27-29 
Exclusive or operation ( 异 或 运算 符 ) 
bitwise ( 按 位 )，891-892, 913 
boolean (布尔 )，987-989 
sum-of-products ( 积 之 和 )，1024-1025 
Execute phase in CPU (CPU 执行 阶段 ),，1079 
Explicit casts《〈 显 式 转型 )，33-34 
Exponential distributions (指数 分 布 )，597 
Exponential order of growth (指数 增长 量 级 )，505 
difficult problems (难题 )，828-829 
intractability ( 难 解 性 )，826 
overview (概述 ) 272-218, 506 
playing card possibilities (扑克 牌 可 能 性 )，823 
running time (运行 时 间 )，507-508 
SAT problem (SAT 问题 )，856 
usefulness (有 效 性 )，858 
Expressions (表达 式 ) 
arithmetic evaluation (算术 运算 )，586-589 
boolean (布尔 )，995-996 
description (描述 )，17 
Lambda, 450 
method calls (方法 调用 )，30 
regular (正则 ) 
Extended Church-Turing thesis (扩展 印 奇 -图 灵 
论题 )，823 
Extensible libraries (可 扩展 库 )，452 
ExtractFloat program (程序 ExtractFloat)，893 
Extracting data (抽取 数据 ) 3$8, 360 


F 


Factor problem ( 因 式 分 解 问题 )，838, 859 

Factorials (因子 )，264-265 

Factoring (分 解 )，72-73, 827, 838 

Factors program (程序 Factors)，72-73 

Fade effect( 淡 入 淡出 效果 )，351-352 

Fade program (程序 Fade)，351-352 

Fair coin flip (公平 硬币 翻转 )，52-53 

Falsifiable hypotheses (证 伪 的 假说 )，495 

Fecundity parameter (繁殖 率 参 数 )，89 

Feedback circuits (回馈 电路 )，1048-1049 

Fermat's Last Theorem ( 费 马 大 定理 )，89, 722 

Ferns, Barnsley〈 巴 恩 斯 利 蕨 )，240-243 

Fetch-increment-execute cycle ( 取 指 -递增 - 执 
行 周期 ),“910-911 


Fibonacci numbers ( 斐 波 那 契 数列 ) 
formulas (公式 )，82 

machine language (机 器 语言 )，935-936 
recursion (递归 )，282-283 

FIFO queues (FIFO 队列 ) 


Files (文件 ) 


concatenating and filtering (拼接 和 过 滤 )，356 

format (格式 )，237 

in IO (在 IO 中 ), 126 

n-body simulation (多 体 模拟 )，483 

redirection ( 重 定向 )，139-141 

splitting (分 裂 )，360 

stock example (股票 示 例 )，411 

symbol tables (符号 表 )，629 

Filled shapes (填充 形状 )，149 

Filters (过 滤器 ) 

exception (异常 )，540 

files (文件 )，356 

image processing (图 像 处 理 )，379 

piping (管道 )，142-143 

standard drawing data (标准 绘图 数据 )，146- 
147 

standard input (标准 输入 )，140 

final keyword (final 关键 字 ) 

description (描述 )，384 

immutable types (不 可 变 类 型 )，440 

instance variables (实例 变量 )，404 
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overview (概述 )，24-2 
precision (预测 )，40 
representing (表示 )，888-890 
storing (存储 )，40 
Flow of control (控制 流 ) 
conditionals and loops (控制 和 循环 ) 
static method calls (静态 方法 调用 )，193-195 
Flowcharts (流程 图 )，51-52 
for loops (for 循环 ) 
continue statement (continue 语句 )，74 
examples (示例 )，61 
nesting ( 肉 套 )，62-64 
working with (共同 作用 )，59-61 
Foreach statements (foreach 语句 )，601-602 
Formal languages (形式 语言 ) 
abstract machines (抽象 机 )，737-738 
alphabets (字母 表 )，720-721 
binary strings (二 进 制 字符 串 )，718-719 
definitions (定义 )，718-723 
DFAs (确定 有 限 状态 自动 机 ) 
recognition problem (识别 问题 )，722 
regular (正则 )，723-729 
regular expressions (正则 表达 式 ) 
specification problem (规范 问题 )，722 
Format, files (格式 文件 )，237 
Format strings (格式 化 字符 串 )，130-131 
Formatted input (格式 化 输入 )，135 


Financial systems, graphs for (金融 系统 、 图 表 )， Formatted printing (格式 化 打印 )，130-132 
673 Forth language (Forth 语言 )，590 
Finite-state transducers (有 限 状态 传感器 )，762 
Finite sums (有 限 和 )，64-65 
First-in first-out (FIFO) queues (先进 先 出 队列 ) 
applications overview (应 用 概述 )，597 
array implementation (数组 实现 )，596 
linked-list implementation (链表 实现 )，593 Fractions( 分 数 )，889-890 
M/M/1 (M/M/1 队列 )，597-600 Fragile base class problem (脆弱 的 基 类 问题 )， 
overview (概述 )，566, 592-593 453 
Flexibility (灵活 性 )，702 Freeing memory (释放 内 存 )，367 
Flip program (程序 Flip)，52-53 Frequencies (频率 ) 
Flip-flops (触发 器 )，1049-1050 counting (计数 )，555 
float data type ( 浮 点 数据 类 型 )，26, 513 sorting (排序 )，556 
Floating-point numbers ( 浮 点 数 ) Zipf "s law ( 齐 夫 定律 )，556 
conversion codes (转换 代码 )，131-132 FrequencyCount program (程序 FrequencyCount)， 
exponents (指数 )，889 555-557 


Fortran language (Fortan 语言 )，1094 

Fourier series( 傅 里 叶 级 数 )，211 

Fractal dimensions (分 形 维度 )，280 

Fractals (分 形 )，278-280 

Fractional Brownian motion (分 形 布朗 运动 )，278 
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Fully parenthesized arithmetic expressions ( 带 完全 
括号 的 算术 表达 式 语句 )，587 
Function calls (函数 调用 ) 
abstraction (抽象)，590-591 
static methods (静态 方法 )，197 
traces (跟踪 )，195 
trees ( 树 )，269, 271 
Function graphs (函数 图 )，148, 248 
Functional interfaces (函数 式 接口 )，450 
Functional programming (函数 化 编程 )，449 
Functional property of programs (程序 的 函数 属性 )， 
812-813 Functions 
boolean (布尔 )，987-991, 994-997 
computing with (计算 ),，449 
defining (定义 )，192 
inverting ( 反 向 )，536-538 
iterated function systems (迭代 本 数 系统 )，239-- 
243 
libraries( 库 ) 
machine language (机 器 语言 )，931-933 
mathematical (数学 )，202-204 
modules (模块 ) 
overview (概述 )，191 
recursive (递归 ) 
static methods (静态 方法 )，193-201 
tables of ( 表 )，907-908 


G 


Gambler program (Gambler 程序 )，70-71 
Gambler’s ruin simulation( 赌 徒 破产 问题 )，69- 
71 

Game of Life (生命 游戏 )，326, 794 
Garbage collection (垃圾 回收 )，367, 516 
Gardner Martin (马丁 “加 德 纳 )，424 
Garey, Michael R. (迈克 尔 * 加 里 )，859 
Gates ( 门 ) 
abstraction layers (抽象 层 )，1037 

AND (与 运算 符 )，1014 

circuits from (电路 )，1019-1021 

multiway (多 路 )，1015-1017 

NOR (或 非 )，1014 

NOT ( 非 ) 1013-1014 

OR (或 )，1014 

overview (概述 )，1013 


sum-of-products( 积 之 和 )，1026-1027 
summary (总 结 )，1018-1019 
universal sets of (通用 集合 )，1045 
Gaussian distribution functions (高 斯 分 布 函数 ) 
API (应 用 程序 编程 接口 )，231 
cumulative (累计 )，202-203 
probability density (概率 密度 )，202-203 
Gaussian elimination (高 斯 消 元 )，830 
Gaussian program (程序 Gaussian)，203 
Gaussian random numbers (高 斯 随机 数 )，47 
General purpose computers (通用 计算 机 )，790 
Generalized multiway gates (广义 多 路 门 )，1016- 
1017 
Generalized regular expressions (广义 正则 表达 
式 )，730-732 
Generic types (通用 类 型 )，583-585 
Genomics (基因 组 学 ) 
application (应 用 )，336-340 
indexing (索引 )，634 
regular expressions (正则 表达 式 )，727,732-734 
symbol tables (符号 表 )，629 
Geometric mean (几何 平均 数 )，162 
Geometry (几何 ) 
abstraction layers (抽象 层 )，1037-1039 
gates《〈 门 )，1015-1016 
German Enigma code (德国 英 格 玛 密码 )，717 
Get operations (Get 操作 ) 
hash tables( 散 列表 )，639 
symbol tables (符号 表 )，624 
Gilbert-Shannon-Reeds model ( Gilbert-Shannon- 
Reeds 模型 )，125 
Glass filters ( 毛 玻璃 过 滤器 )，379 
Global clustering coefficients (全 局 聚 类 系数 )， 
13 
Global variables (全 局 变量 )，284 
Glossary of terms (术语 表 )，1097-1101 
G6del, Kurt〈 库 尔 特 " 哥 德 尔 )，807, 840 
Golden ratio (黄金 比例 )，83 
Goldstine, Herman ( 赫 尔 曼 : 戈 德 斯 坦 )，925 
Gore, Al (阿尔 . 苞 尔 )， 436 
Gosper, R.( 高 斯 帆 )，805 
Goto statements (goto 语句 )，926 
Graph data type (图 数据 类 型 )，675-679 
Graph program (程序 Graph)，676-679 
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Graphics (图 形 ) 
recursive (递归 )，276-277; 397 
turtle ( 鸟 包 );，394-=396 
Graphs (图 ) 
bipartite (二 分 图 );，682 
client example (客户 端 示例 )，679-682 
connected components (连接 组 件 ) 709 
dependency (依赖 性 )，252 
description (描述 )，671 
DFAs (确定 有 限 状 态 自 动机 )，738 
diameters (直径 )，711 
directed (有 向 )，711 
examples (示例 )，695 
function (函数 )，148, 248 
generators( 生 成 器 )，700 
Graph data type (图 数据 类 型 )，675-679 
grid (网 格 )，708 
isomorphism problem( 同 构 问 题 )，859 
lessons (经 验 总 结 )，700-702 
matching (匹配 )，713 
overview (概述 )，670-671 
random web surfer( 随 机 网 络 冲 浪 )，170 
small-world(〈 小 世界 )，693-699 
systems examples (系统 示例 )，671-674 
vertex cover (顶点 覆盖 )，828, 834, 842 
Gravity (重力 )，481 
Gray codes (格雷 码 )，273-275 
Grayscale ( 灰 度 图 ) 
Color (颜色 )，344 
image processing (图 像 处 理 )，347=349 
Grayscale program ( 灰 度 图 程序 )，347-349 
Greater than signs (>) 
bitwise operations( 按 位 运算 )，891-892 
comparisons (比较 )，27-29 
lambda expressions (Lambda 表达 式 ); 450 
redirection 〈 重 定向 )，139-140 
Greatest common divisor (gcd)( 最 大 公约 数 ) 
machine language( 机 器 语言 )，931 
recursive algorithm (递归 算法 )，267-268 
TOY machine (TOY 机 )，918-921 
Grep program (程序 Grep)，736 
grep tool (grep 工具 ) 
filters〈 过 滤器 )，142-143 
regular expressions (正则 表达 式 )，734-736 


Grid graphs( 网 格 图 )，708 

Guarantees (保证 ) 
NP-complete problems (NP 完全 问题 )，852 
performance (性能)，512, 627 
worst-case analysis (最 坏 情况 分 析 )，825 


H 


H-trees of ordern (n 阶 瑞 树 )，276-277 
Hadamard matrices〈 哈 达 玛 矩阵 )，122 
Halt instructions (停机 指令 ) 
CPU (中 央 处 理 器 )，1079 
TOY machine (TOY 机 )，912 
Halting problem (停机 问题 )，808-810 
Hamilton, William (威廉 ' 汉密尔顿 )，424 
Hamming distances ( 汉 明 距离 )，295 
Handles for pointers (指针 句柄 )，371 
Hardy, G. 百 .〈 戈 弗 雷 * 哈 罗 德 ， 哈代)，86 
Harel, David (大 卫 : 哈 尔 )，780 
Harmonic mean (调和 平均 值 )，162 
Harmonic numbers ( 谐 波 数 ) 
finite sums (有 限 和 )，64-65 
function implementation (函数 实现 )，199 
Harmonic program (程序 Harmonic)，193-195 
HarmonicNumiber program (程序 HarmonicNumber)， 
64—65 
Harmonics and chords (和 声 和 和 弱 )，211 
Hash codes and hashing operation ( 散 列 代码 和 散 
列 操作 ) 
object equality (对 象 相等 )，454-455 
sketches (文档 摘要 )，460 
strings (字符 串 )，515 
symbol tables (符号 表 )，624 
Hash functions( 散 列 函 数 )，636 
Hash tables( 散 列表 )，636-639 
Hash values( 散 列 值 )，636 
Hashable keys (可 散 列 的 键 )，626 
hashCode() method (hashCode() 方法 ) 
Object (对 象 )，453, 455-456 
String (字符 串 )，332 
HashMap class (HashMap 类 )，655 
HashST program (程序 HashST)，637-638 
Heap memory( 堆 内 存 )，516 
Heap-ordered binary trees( 堆 有 序 的 二 又 树 )，661 
Height in binary search trees (二 又 搜索 树 的 高 度 )， 


640 
HelloWorld program (程序 HelloWorld), 4-6 
Hertz (赫兹 )，155 
Hexadecimal (hex) notation (十 六 进 制 表示 法 ) 
conversions with binary (转换 为 二 进 制 )，876- 
877 
description (描述 )，875-876 
examples( 示 例 )，878-879 
literals (常量 )，891 
memory (内 存 )，909 
Hilbert, David ( 戴 维 : 希 尔 伯 特 )，425, 806, 816 
Hilbert curves ( 希 尔 伯 特 曲线 )，425 
Hilbert”s 10th problem ( 希 尔 伯 特 十 大 问题 )，816 
Hilbert”s program ( 希 尔 伯 特 程序 )，806-807 
Histogram program (直方 图 程序 )，392-393 
Histograms (直方 图 )，177 
Hoare, C. A. R. (查尔斯 * 安东尼 : 理 查 德 ， 霍 尔 
恬 士 )，518 
Hollywood numbers (好 莱 坞 数 )，711 
Horner William (威廉 : 霍 纳 )，957 
Horner’s method (和 霍 纳 方法 )，223, 882,956-957 
Htree program (程序 Htree)，276-277 
Hurst exponent( 赫 斯 特 指数 )，280 
Hyperbolic functions ( 双 曲 函数 )，256 
Hyperlinks ( 超 链接 )，170 
Hypotenuse of right triangles( 直 角 三 角形 的 斜 边 )， 
199 
Hypotheses (假说) 
doubling (倍增 )，496, 498-499 
falsifiable (可 证 伪 的 )，495 
mathematical analysis (数学 分 析 )，498,500-502 
overview (概述 )，496 


IO (输入 输出 ) 
Identifiers (标识 符 )，15-16 
Identities (标识 ) 
Boolean algebra (布尔 代数 )，989-990 
exclusive or function( 异 或 函数 )，993 
objects (对 象 )，338, 340 
IEEE 754 standard (IEEE754 标准 )，40, 888-889 
if statements (让 语句 ) 
nesting ( 嵌 套 )，62 
working with (共同 作用 )，50-53 


IFS program (IFS 程序 )，241, 251 
IllegalFormatConversionException, 131 
ILP problem ( integer linear programming problem ) 
(ILP 问题 ， 整 数 线性 规划 问题 )，831 
NP-completeness (NP 完全 性 )，846 
vertex cover problem (顶点 覆盖 问题 )，842 
Immutable types (不 可 变 类 型 )，364, 439 
advantages (优点 ) 440 
arrays and strings (数组 与 字符 串 )，439-440 
cost (代价 )，440 
example (示例 )，442-445 
final modifier (final 修饰 符 )，440 
references (引用 )，441 
symbol table keys (符号 表 键 )，625, 655 
Implementation (实现 ) 
API methods (API 方 法 )，231 
interfaces (接口 )，447 
Implements clause (实现 子 句 )，447 
Implicit type conversions( 隐 式 类 型 转换 )，33 
In data type (内 置 数 据 类 型 )，354-356 
Incremental development ( 增 量 开 发 )，319, 701 
Incrementers, binary (二 进 制 递增 器 )，769-771 
Index program (程序 Index) 632-634 
IndexGraph program (程序 IndexGraph)，680-682 
Indexing (索引 ) 
arrays (数组)，90, 116 
String (字符 串 )，332 
symbol tables (符号 表 )，624, 632-634 
Zero-based〈 零 基 ， 从 0 开始 )，92 
Induced subgraphs (导出 子 图 )，705 
Induction (归纳 ) 
mathematical (数学 )，262, 266 
recursion step (递归 步骤 )，266 
Infinite loops (无 限 循环 )，76, 808-812 
Infinite tape for Turing machines (用 于 图 灵机 的 无 
限 纸 带 )，769, 774 
Infinity value (无 限 值 )，26, 40 
Information content of strings (字符 串 的 信息 内 
容 )，378 
Information representation (信息 表示 ) 
Inheritance (继承 ) 
multiple〈 倍 数 )，470 
subclassing ( 子 类 化 )，452-457 
subtyping ( 子 类 型 )，446-451 


Initialization array (初始 化 数组 )，93 
inline (内 联 )，18 
instance variables (实例 变量 )，415 
two-dimensional array (二 维 数组 )，106-107 
Inline variable initialization (内 联 变量 初始 化 )，18 
Inner classes (内 置 类 )，609 
Inner loops (内 循环 ) 
description (描述 )，62 
performance (性 能 )，500, 510 
Inorder tree traversal (有 序 树 遍历 )，649 
Input (输入 ) 
arithmetic logic units (算术 逻辑 单元 )，1031 
array libraries (数组 库 )，237-238 
circuit models (电路 模型 )，1002-1004 
clocks (时 钟 )，1060 
command-line arguments (命令 行 参数 ),，7 
data types (数据 类 型 )，353 
demultiplexers (多 路 分 配器 )，1022 
file concatenation (文件 连接 )，356 
gates ( 门 ),，1013 
insertion sorts (插入 排序 )，548-549 
machine-language (机 器 语言 )，936-938 
multiplexers (多 路 复 用 器 )，1019-1020 
overview (概述 )，126-129 
in performance (性 能 )，510 
program counters〈 程 序 计 数 器 )，1073-1075 
random web surfer (随机 网 络 冲浪 )，171 
screen scraping (屏幕 抓 取 )，357-359 
standard (标准 )，132-138 
stream data type〔 流 数据 类 型 )，354-355 
virtual machines (虚拟 机 )，969-970 
Input/off switches (输入 /关闭 开关 )，1005 
InputMismatchException, 135 
Inserting (搬入 ) 
BST nodes (BST 节点 )，644-645 
linked list nodes (链表 节点 )，573-574 
Insertion program (程序 Insertion )，546-547 
Insertion sorts (插入 排序 ) 
data types (数据 类 型 )，545-548 
input sensitivity (输入 敏感 )，548-549 
overview (概述 )，543-544 
performance (性 能 )，544-545 
InsertionDoublingTest 
program (程序 )，548-549 
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Instance methods (实例 方法 ) 
data types (数据 类 型 )，385-386 
invoking (调用 )，334 
vs. static (静态 )，340 
Instance variables (实例 变量 ) 
Complex program (程序 Complex)，403-404 
data types (数据 类 型 )，384 
initial values (初始 值 )，415 
Instances of objects (对 象 实例 )，333 
Instruction register (IR)( 指 令 寄 存 器 )，910 
Instructions (说 明 ) 
components (组 件 )，911 
CPU (中 央 处 理 器 ),，1079-1080 
as data (作为 数据 )，922-924 
execution time (执行 时 间 )，509 
instruction sets (指令 集 )，911-913 
parsing (解析 )，966-967 
TOY machine (TOY 机 )，909 
TOY-8 machine (TOY-8 机 )，1070-1071 
Integer linear inequality (整数 线性 不 等 式 ) 
satisfiability (可 满足 性 )，831, 838, 845 
Integer linear programming (整数 线性 编程 )，831 
NP-completeness (NP 完全 性 )，846 
vertex cover problem (顶点 覆盖 问题 )，842 
Integer.parseInt() method (Integer.parseInt() 方法 ) 
calls to (调用 )，30-31 
type conversion (类 型 转换 )，21, 23, 34 
strings (字符 串 )，880-882 
Integers and int data type (整数 和 int 数据 类 型 ) 
arithmetic (算术 )，884-885 
bitwise operations ( 按 位 操作 )，891-892 
conversion codes (转换 代码 )，131-132 
description (描述 )，14-15 
input (输入 )，133-134 
overview (概述 ) 22-24 
Integrals, approximating (近似 积分 )，449 
Integrated developmentenvironments ( IDEs) (集成 
开发 环境 )，3 
Integration, definite ( 定 积分 )，816 
Interactions between modules (模块 之 间 的 交互 )， 
319 
Interactive user input (交互 式 用 户 输入 )，135-136 
Interface construct (接口 构造 )，446 
Interfaces (接口 ) 
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APIs (应 用 程序 编程 接口 )，430 
built-in (内 置 )，451 
circuit models (电路 模型 )，1003 
CPU (中 央 处 理 器 )，1076 
defining (定义 )，446 
functional ( 泛 函 )，450 
gates ( 门 )，1016-1017 
implementing (实现 )，447 
memory (内 存 )，1054 
multiplexers (多 路 复 用 器 )，1020 
program counters (程序 计数 器 )，1073 
using (使 用 )，447-448 
Internet DNS (互联 网 DNS)，629-630 
Internet Protocol (IP)( 互 联网 协议 )，435 
Interpolation in fade effect (渐变 效果 中 的 插值 )， 
351 
Interpreters (解释 器 ) 
Evaluate program (程序 Evaluate), 589 
TOY machine (TOY 机 )，964 
IntOps program (程序 IntOps)，23 
Intractability ( 难 解 性 ) 
difficult problems〔 难 问题 )，828-829 
easy problems (简单 问题 ) 829 
exponential-time algorithms (指数 时 间 算 法 )，826 
main question (主要 问题 ) 840-841 
NP-completeness (NP 完全 性 ) 
numbers (数字 )，827 
overview (概述 )，822-824 
path problems (路 径 问题 )，829 
polynomial-time algorithms (多 项 式 时 间 算 法 )， 
825-826 
polynomial:time reductions (多 项 式 时 间 归 纳 )， 
841-843 
problem size (问题 规模 )，824 
satisfiability (可 满足 性 )，830-832 
search problems (搜索 问题 )，833-840 
subset sum problem ( 子 集 和 问题 )，827-828 
vertex cover (顶点 覆盖 )，828 
worst case (最 坏 情 况 )，825 
Introduction to the Theory of Computation book( 计 
算 机 理论 人 门 书 )，780 
Invariants in assertions (断言 中 的 不 变量 )，467 
Inverse permutations ( 道 排 序 )，122 
Inverters( 反 向 )，1013-1014 


Inverting functions ( 反 向 函数 )，536-538 
Invoking instance methods (调用 实例 方法 )，334 
IP (Internet Protocol)( 互 联网 协议 )，435 
IPv4 (IPv4 协议 ) 
Vs. IPV6 (对 比 Ipv6 协议 )，435 
number of addresses (地 址 数 )，900, 904 
IPv6 (Ipv6 协议 ) 
vs. IPv4 (对 比 IPv4 协议 )，435 
number of addresses (地 址 数 )，901 
IR (instruction register)( 指 令 寄 存 器 )，910 
IR write control line (IR 写 控制 线 )，1082 
ISBN ( International Standard BookNumber， 国 际 
标准 书号 )，86 
Isolated vertices in graphs( 图 中 的 孤立 顶点 )，703 
Isomorphic binary trees〈 同 构 二 又 树 )，661 
Isomorphism in graphs (图 中 的 同 构 )，859 
Items in collections (集合 中 的 项 )，566 
Iterable interface (可 迭代 的 接口 )，451, 602 
Iterable collections (可 迭代 集合 )，601-605 
arrays( 数 组)，603 
linked lists (链表 )，604-605 
Queue (队列 )，604-605 
SET (集合 )，652 
Stack(〈 栈 )，603 
Iterated function systems (迭代 函数 系统 )，239-243 
Iterations in BSTs (BST 中 的 迭代 ),650 
Iterator interface (和 迭代 器 接口 )，451, 602-605 


J 


Java command (Java 命令 )，3, 134 
.java extension (.java 扩展 名 )，3; 6, 8, 197, 383 
Java language (Java 语言 ) 
benefits (好 处 )，9 
libraries ( 库 )，1094 
overview (概述 )，1-8 
Java platform (Java 平台 )，2 
Java Virtual Machine (JVM ，Java 虚拟 机 ) 
description (描述 )，3 
overview (概述 )，965-966 
as program (作为 程序 )，788 
Java virtual machines (Java 虚拟 机 )，429 
Johnson, David S. (大 卫 ，… 约翰 还)，859 
Josephus problem (约瑟夫 问题 )，619 
Julia sets〈 朱 利 亚 集合 )，427 


Jump and link instruction ( 跳 转 和 链接 指令 )，931 
Jump register instruction ( 跳 转 寄存 器 指令 )，931 


K 


K-ring graphs (K 阶 环 图 )，694-695 
K-way mnultiplexers (K 路 多 路 复 用 器 )，1019-1020 
Kamasutra ciphers (Kamasutra 密码 )，377 
Karp, Richard (卡尔 普 ， 理 查 德 )，845-848 
Karp’s reductions (卡尔 普 归 约 ) 
NP-completeness (NP 完全 性 )，845-848 
polynomial-time (多 项 式 时 间 )，841 
Kevin Bacon game ( 凯 文 * 贝 肯 游戏 )，684-686 
Key-sorted tree traversal ( 键 有 序 树 遍 历 ),649 
Keys ( 键 ) 
BSTs (二 分 搜索 树 )，640-642, 650 
cryptographic (密码 学 )，992 
immutable (不 可 变 )，625 
Kamasutra ciphers (Kamasutra 密码 )，377 
symbol tables (符号 表 )，624-626, 655 
Key-value pairs( 键 - 值 对 )，624-626 
Kleene; Stephen (史蒂芬 ， 克 林 )，748 
Kleene’s theorem( 克 林 定 理 ) 
applications (应 用 )，753-756 
DFA, NFA, and RE equivalence (DFA、NFA 和 
RE 等 价 )，749-752 
overview (概述 )，748 
power limitations (功率 限制 )，753-756 
proof strategy (证 明 策 略 )，748 
RE recognition (RE 识别 )，753 
Knuth, Donald (唐纳德 . 克 努 特 ) 
MIX machine (MIX 机 )，947 
optimization (优化 )，518 
running time (运行 时 间 )，496, 501 
SAT solvers (SAT 解决 器 ) 832 
Koch program (程序 Koch); 397 


L 


Ladders, word ( 词 梯 )，710 

Ladner, R. ( 理 查 德 . 拉 德 纳 )，859 

Lambda calculus (Lambda 演算 )，790, 794 
Lambda expressions (Lambda 表达 式 )，450 
Languages (语言 ) 

Last-in first-out (LIFO， 后 进 先 出 )，566-567 
Lattices in random walks (随机 游 走 网 格 )，112- 
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115 
Layers of abstraction (抽象 层 )，1037-1039 
LCS (longest commonsubsequence， 最 长 公共 子 序 
列 )，285-288 Leading zeros, 883 
Leaf nodes in BSTs (二 又 搜索 树 的 叶子 节点 )， 
640 
Leaks, memory (内 存 泄漏 ), 367, 581 
LeapYear program (程序 LeapYear)，28-29 
Left associativity ( 左 结合 )，17 
Left shift operations ( 左 移 操作 ) 
bitwise( 按 位 )，891-892 
TOY machine (TOY 机 )，913 
Left subtrees ( 左 子 树 )，640 
Length (长 度 ) 
arrays (数组 )，91-92 
graphs paths (图 路 径 )，674, 683 
strings (字符 串 )，332 
Less than signs (<) 
bitwise operations ( 按 位 运算 )，891-892 
comparisons (比较 ), 27-29 
redirection ( 重 定向 )，140-141 
Let"s Make a Deal simulation (让 我 们 进行 交易 模 
拟 )，88 
Levin, Leonid ( 莱 昂 纳 德 ， 莱 维 )，845 
Liar’s paradox (说 谎 者 悖 论 )，807-808 
Libraries ( 库 ) 
APIs (应 用 程序 编程 接口 ), “230=232 
array IO (数组 IO)，237-238 
clients (客户 端 )，230 
extensible (可 扩展 的 )，452 
Java, 1094 
methods (方法 )，29-32 
modifying (修改 )，255 
in modular programming (模块 化 编程 )，227- 
228, 251-254 
modules (模块 )，191 
overview (概述 )，226, 230 
random numbers (随机 数 )，232-236 
statistics 《统计 )，244-250 
stress testing (压力 测试 )，236 
unit testing (单元 测试 )，235 
LIFO (last-in first-out， 后 进 先 出 )，566-567 
Lights for TOY machine (TOY 机 指示 灯 )，916 
Lindenmayer Systems (Lindenmayer 系统 )，803 
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Linear algebra for vectors (向 量 的 线性 代数 )， 
442—443 
Linear equation satisfiabilityproblem (线性 方程 的 
可 满足 性 问题 ) 830, 839 
Linear feedback shift registers (LFSR， 线 性 反馈 
移 位 寄存 器 )，1000-1001 
Linear inequality satisfiabilityproblem (线性 不 等 
式 可 满足 性 问题 )，831, 839 
Linear interpolation( 线 性 插值 )，351 
Linear order of growth (线性 增长 量 级 )，504- 
505,507-—508 
Linear programming problem (线性 编程 问题 )，831 
Linearithmic order of growth (线性 对 数 增长 量 级 )， 
504--505, S07-S08 
Linked lists (链表 ) 
circular ( 环 路 )，622 
FIFO queues (FIFO 队列 )，593, 596 
hash tables( 散 列表 )，636 
iterable classes (可 迭代 类 )，604-605 
overview (概述 )，571-574 
stacks ( 栈 )，574-576 
summary (总 结 )，578 
symbol tables (符号 表 )，635 
traversal (遍历 )，574, 577 
Linked structures (链接 结构 ) 
LinkedStackOfStringsprogram (程序 LinkedStackOf- 
Strings), 574-576 
Links in BSTs (二 又 搜索 树 中 的 链接 )，640-642 
Lipton, R. J.( 理 查 德 . 利 普 顿 )，856 
Lissajous, Jules A.( 朱 勒 * A. 李 萨 如 )，168 
Lissajous patterns( 李 萨 如 模式 )，168 
Lists, linked (链表 ) 
Literals (常量 ) 
array elements (数组 元 素 )，116 
binary and hex (二 进 制 和 十 六 进 制 )，891 
booleans (布尔 )，26 
characters (字符 )，18-19 
description (描述 )，15 
floating-point numbers( 浮 点 数 )，24 
integers (整数 )，22 
strings (字符 串 )，19, 334 
Little'"s law( 利 特 尔 法 则 )，598 
Load address instruction (加载 地 址 指令 )，1080 
Load instructions (加 载 指令 )，938, 1080 


LoadBalance program (程序 LoadBalance)，606- 
607 

Local clustering (局 部 聚 类 性 )，693-694 

Local variables (局 部 变量 ) 

Vs. instance variables (对 比 实例 变量 )，384 

static methods (静态 方法 )，196 

Logarithmic order of growth (对 数 增长 量 级 )，503 

Logarithmic spirals (对 数 螺旋 )，398-399 

Logical design (逻辑 设计 )，1008-1009 

Logical instructions (逻辑 指令 )，912-913 

Logical shifts (逻辑 移 位 )，891-892 

Logical switches (逻辑 开关 ) 

bus muxes (总 线 多 路 复 用 器 )，1036 

demultiplexers (多 路 分 配器 )，1022 

multiplexers (多 路 复 用 器 )，1020 

Logo language (Logo 语言 )，400 

Loitering condition (游离 情况 )，581 

Long data type (长 数据 类 型 )，24, 513 

Long path problems (长 路 径 问 题 )，829 

Longest common subsequence (LCS ， 最 长 公共 子 
序列 )，285-288 

Longest path problem (最 长 路 径 问 题 )，838 

LongestCommonSubsequenceprogram (程序 Longest- 
CommonSubsequence), 286-288 

Lookup program (程序 Lookup)，630-632 

Loops (循环 ) 

Lost letter (丢失 的 信 )，840 

Lower bounds (下 界 )，826 

Luminance (亮度 )，343-345 

Luminance program (程序 Luminance)，344-345 


M 


M/M/1 queues (M/M/1 队列 )，597-600 
MAC addresses (MAC 地 址 )，877 
Machine-language programming (机 器 语言 编程 ) 

arrays (数组 )，938-941 

benefits( 优 点)，945 

description (描述 )，907 

functions (函数 )，931-933 

overview (概述 )，930 

standard input (标准 输入 )，936-938 

standard output (标准 输出 )，934-936 
summary (总 结 )，945-946 
TOY machine (TOY 机 )，914 


Magnitude ( 模 / 极 径 / 大 小 ) 
complex numbers (复数 )，402-403 
spatial vectors (空间 向 量 )，442-443 
Magritte, René( 勒 内 马 格 里 特 )，363 
main() methods (main() 方法 )，4-5 
multiple (倍数 )，229 
transfer of control (转移 控制 )，193-194 
Majority function (表决 器 函数 ) 
adder circuits (加 法 器 电路 )，1028-1030 
sum-of-products circuits ( 积 之 和 电路 )，1027 
truth tables for ( 真 值 表 )，1025 
Mandelbrot, Benoit (本 华 . 曼 德 布 洛 特 )，297， 
406 
Mandelbrot program (程序 Mandelbrot program )， 
406-409 
Maps (地 图 )，Mercator projections ( 墨 卡 托 投影 )，48 
Markov, Andrey ( 安 德 烈 .马尔 可 夫 )，176 
Markov chains (马尔 可 夫 链 ) 
impact (影响 )，184 
mixing (混合 )，179-184 
overview (概述 )，176 
power method ( 乘 寡 方法 )，180-181 
squaring (〈 自 乘 )，179-180 
Markov model paradigm (马尔 可 夫 模 型 范例 )， 
460 
Markov program (程序 Markov)，180-182 
Markov systems (马尔 可 夫 系 统 )，802-803 
Markovian queues (马尔 可 夫 队 列 )，597 
Marsaglia’s method (马尔 萨 利 亚 方法 )，85, 259 
Masking bitwise operations (屏蔽 按 位 运算 )， 
892—893 
Matcher class for REs (RE 的 Matcher 类 )，763 
Matching graphs (匹配 图 )，713 
Math library (Math 库 )，192 
accessing (访问 )，228 
methods (方法 )，30-32, 193, 198 
Mathematical analysis (数学 分 析 )，498-502 
Mathematical functions (数学 函数 )，202-204 
Mathematical induction (数学 归纳 )，262, 266 
Mathematical models (数学 模型 )，716 
Matiyasevich, Yuri ( 尤 里 : 马 季 亚 谢 维 奇 )，816 
Matlab language (Matlab 语言 )，1094 
Matrices (矩阵 ) 
boolean (布尔 )，302 
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Hadamard (哈达 玛 )，122 
images (图 像 ) 346-347 
matrix multiplication (和 矩阵 乘法 )，109 
sparse( 稀 玖 )，666 
transition ( 转 置 )，172-173 
two-dimensional arrays (二 维 数 组 );，106, 109- 
110 
vector multiplication (向 量 乘法 )，110, 180 
Mauchly, John( 约 翰 * 葛 奇 利 )，924-925 
Maximum values in arrays (数组 最 大 值 )，209 
Maximum keys in BSTs (二 又 搜索 树 的 最 大 键 )， 
651 
Maxwell-Boltzmann distributions ( 克 斯 韦 - 玻 耳 
兹 曼 分 布 )，257 
McCarthy’s 91 function (麦卡锡 91 函数 )，298 
Mechanical systems, graphs for (机 器 系统 图 表 )，673 
Memoization (记忆 )，284 
Memory (内 存 ) 
arrays (数组)，91, 94, 515-517 
ArrayStackOfStrings,569—570 
available (可 用 的 )，520 
bit-slice design( 位 片 设计 )，1054-1056 
circuits (电路 )，1054-1057 
feedback loops as (反馈 循环 )，1048 
flip-flops( 触 发 器 )，1049-1050 
interfaces (接口 )，1054 
leaks (泄漏 )，367, 581 
linked lists (链表 )，571 
memory bits (内 存 位 )，1056 
objects (对 象 )，338, 514 
performance (性 能 )，513-517 
recursion〈 递 归 )，282 
references (引用 ),，367 
safe pointers (安全 指针 )，366 
strings (字符 串 )，515 
TOY machine (TOY 机 )，908-909 
two-dimensional arrays (二 维 数组 )，107 
virtual (虚拟 )，972, 975-976 
Memory dumps (内 存 导出 )，909 
Memory instructions (内 存 指令 ) 
address instructions (地 址 指令 )，912 
TOY machine (TOY 机 )，913 
Memory writes for CPU (CPU 内 存 写 入 )，1079 
Memoryless queues (无 记忆 队列 )，597 
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Mercator projections ( 墨 卡 托 投影 )，48 
Merge program (程序 Merge),550-552 
Mergesort (归并 排序 ) 
divide-and-conquer (分 而 治之 )，554 
overview (概述 )，550-552 
performance (性 能 )，553 
Metacharacters (元 字符 )，724, 730-731 
Method references (方法 引用 )，470 
Methods (方法 ) 
abstract (摘要 )，446 
call chaining (调用 链 )，404 
deprecated (已 弃 用 )，469 
instance (实例 )，334, 385-386 
instance vs. static( 实 例 与 静态 比较 )，340 
library ( 库 )，29-32 
main(), 4-—5 
overriding ( 重 写 )，452 
static (静态 ) 
stub (存根 )，303 
variables within (变量 )，386-388 
MIDI Tuning Standard (MIDI 调制 标准 )，161 
Midpoint displacement method (中 点 偏 移 法 )， 
278, 280 
Milgram, Stanley (斯 坦 利 .米尔 格拉 姆 )，670 
Minimum keys in BSTs (二 又 搜索 树 中 的 最 小 键 )， 
651 
Minsky, Marvin( 马 文 * 明 斯 基 )，780, 794 
Minus signs (—) 
compound assignments (组 合 赋值 )，60 
floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22 
lambda expressions (Lambda 表达 式 )，450 
MIX machine (MIX 机 )，947 
Mixed-type operators (混合 类 型 运算 符 ),27=29 
Mixing Markov chains (混合 马尔 可 夫 链 )，176， 
179—184 
MMI1Queue program (程序 MM1Queue)，598-600 
Models( 模 型) 
circuit (电路 ) 
computational (计算 )，716 
mathematical (数学 )，716 
universal (通用 )，794-797 
Modular programming (模块 化 编程 )，191 
classes in (类 )，227-229 


code reuse (代码 复 用 )，226, 253 

debugging (调试 )，253 

encapsulation (封装 )，432 

flow of control in (控制 流程 )，227-228 

libraries in( 库 )，251-254 

machine language( 机 器 语言 )，932 

maintenance (维护 )，253 

program size (程序 规模 )，252-253 
Modules (模块 ) 

abstraction layers (抽象 层 )，1037 

as classes( 作 为 类 )，228 

CPU (中 央 处 理 器 )，1076 

description (描述 )，1034 

interactions (交互 ),，319 

overview (概述 )，191 

program counters (程序 计数 器 )，1073 

size (规模 大 小 )，319 

summary (总 结 )，254 
Monochrome luminance ( 单 色 亮度 )，343-344 
Monte Carlo simulation (蒙特 卡 洛 模拟 )，300,307- 

308 

Moore’s Law (摩尔 定律 ) 

coping with (应 对 )，971 

description (描述 )，507-508 
Move-to-front strategy (“移动 到 前 端 ” 策略 )， 

620 

Movie-performer graph (电影 - 演员 图 )，680 
Multidimensional arrays (多 维 数组 )，111 
Maultiple arguments (多 个 参数 )，197 
Multiple inheritance (多 个 继承 )，470 
Multiple main() methods (多 个 main() 方法 ) 229 
Multiple return statements (多 返回 语句 )，198 
Multiple IO streams (多 输入 输出 流 )，143 
Multiplexers (多 路 复 用 器 ) 

bus switching (总 线 切 换 )，1035 

description (描述 )，1023 

selection (选择 ) 1019-1020 
Multiplication (乘法 ) 

complexmumbers( 复 数 )，402-403 

floating-point numbers ( 浮 点 数 ),， 24-26 

integers (整数 )，22-23, 885 

matrices (和 矩阵 )，109=110 

P search problems (P 搜索 问题 )，839 

polar representation ( 极 坐 标 表示 )，433 


Multiway gates (多 路 门 )，1015-1017, 1023 
Music (音乐 )，155-159 
Mautable types (可 变 类 型 )，364, 439 


N 


N-body simulation (多 体 模拟 ) 

Body data type (天 体 数据 类 型 )，479-480 

file format (文件 格式 )，483 

force ( 力 )，480-482 

overview (概述 )，478-479 

summary (总 结 )，488 

Universe data type (Universe 数据 类 型 )，483-487 
Names (名称) 

arrays (数组)，91 

methods (方法 )，5, 30, 196 

objects (对 象 )，362 

variables (变量 )，16 

vertices (顶点 )，675 
NaN value (NaN， 非 数值 )，26, 40 
NAND function (NAND 函数 )，989-991 
Nash, John (约翰 纳什 )，840 
Natural numbers (自然 数 )，875 
Natural recursion (自然 递归 )，262 
Negation axiom (否定 公理 )，990 
Negative numbers (负数 ) 

array indexes (数组 索引 )，116 

representing (表示 )，38, 886-888 
Neighbor vertices (邻居 顶点 )，671 
Nested classes (由 套 类 ) 

iterators (迭代 器 )，574 

linked lists (链表 )，603-605 
Nesting conditionals and loops( 罕 套 条 件 和 循环 )， 

62-04 

new keyword (new 关键 字 ) 

constructors (构造 函数 )，385 

Node objects (Node 对 象 )，609 

String objects (String 对 象 )，333 
Newcomb, Simon (西蒙 . 纽 科 姆 )，224 
Newline characters (\n， 新 行 ) 

compiler considerations (编译 环境 )，10 

escape sequences( 转 义 序列 )，19 
Newton, Isaac ( 艾 萨 克 . 牛顿 ) 

dice question ( 般 子 问题 )，88 

motion simulation (运动 模拟 )，478-479 
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square root method (平方 根 计算 )，65 
Newton’s law of gravitation (牛顿 万 有 引力 定律 )， 
481 
Newton’”s method (牛顿 迭代 法 )，65--67 
Newton’s second law of motion (牛顿 第 二 运动 定 
律 )，480-481 
NFAs ( 非 确定 有 限 状态 自动 机 ) 
90-10 rule (90-10 规则 )，170, 176 
Nodes (节点 ) 
BSTs (二 分 搜索 树 )，640-642, 942 
linked lists (链表 )，571-573 
new keyword (new 关键 字 )，609 
Nondeterministic finite-state automata (NFA ， 非 确 
定 有 限 状 态 自动 机 ) 
DFA equivalence (DFA 等 价 )) 749-750 
Kleene’s theorem ( 克 林 定 理 ) 
overview (概述 )，744 
RE equivalence (RE 等 价 )，750-751 
recognition problem (识别 问题 )，744-745 
trace example (追踪 示例 ), 747 
Nondominant inner loop ( 非 主导 地 位 的 内 循环 ) s， 
510 
NOR function (NOR 函数 )，989-991 
NOR gates (或 非 门 ) 
cross-coupled (交叉 耦合 )，1050 
description (描述)，1014 
Normal distribution functions ( 正 态 分 布 函 数 ) 
cumulative (累计 )，202-203 
probability density (概率 密度 )，202-203 
NOT gates ( 非 门 )，1013-=1014 
Not operation ( 非 操 作 )，26-27, 987-989 
NP-completeness (NP 完全 性 ) 
addressing problems (解决 问题 )，852 
boolean satisfiability (布尔 可 满足 性 )，853-856 
classifying problems (分 类 问题 )，851 
Cook-Levin theorem ( 库 克 -= 莱 文 定理 )，844-847 
coping (应 对 )，850-857 
Karp’s reductions (卡尔 普 归 约 )，845-848 
overview (概述 )，843-844 
proving (证 明 )，844-849 
NP-hard problems (NP 难 问题 )，858 
NP search problems (NP 查找 问题 ) 
difficult (困难 的 )，837 
easy (简单 的 )，837 
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main question (主要 问题 )，840-841 
nondeterminism ( 非 确定 性 )，835 
overview (概述 )，833 
solutions (解决 方法 )，835 
subset sum ( 子 集 和 )，834 
TSP problem (TSP 问题 )，862 
vertex cover problem (顶点 覆盖 问题 )，834; 842 
0/1 ILP problem (0/1 ILP 问题 )，835 
Null calls (空调 用 )，312 
Null keys in symbol tables (符号 表 中 的 空 键 )， 
626 
Null links in BSTs (二 又 搜索 树 中 的 空 链接 )，640 
Null nodes in linked lists( 二 又 搜索 树 中 的 空 节点 )， 
571-572 
null keyword (null 关键 字 )，415 
Null transitions in NFAs (NFA 中 的 空转 换 )， 
744—746 
Null values in symbol tables (符号 表 中 的 空 值 )， 
626 
NullPointerException, 370 
Numbers (数字 ) 
conversions (转换 )，21, 67-69, 880-881 
intractability( 难 解 性 )，827 
negative (人 负 的 )，886-888 
real ( 真 值 )，888-890 
Numerical integration (数值 积分 )，449 
Nyquist frequency ( 奈 奎 斯 特 频率 )，161 


O 


Object class (对 象 类 )，453-455 
Object-oriented programming (面向 对 象 编程 ) 
data types (数据 类 型 ) 
description (描述 )，254 
overview (概述 )，329 
Objects (对 象 ) 
arrays (数组 )，365 
collections (集合 )，582-583 
comparing (比较 )，364, 545-546 
Complex (复数 )，404 
equality (相等 性 )，454-456 
memory (内 存 )，514 
names (名 称 )，362 
orphaned (孤立 )，366 
references (引用 )，338-339 


String, 333-334 
type conversions (类 型 转换 )，339 
uninitialized Variables (未 初始 化 的 变量 )，339 
working with (共同 协作 )，338-339 
Observations (观察 )，495-496 
Occam’s Razor ( 奥 卡 姆 的 剃刀 )，814 
Octal representation (八进制 表示 )，898 
Odd parity function (奇偶 校 验 函数 ) 
adder circuits (加 法 器 电路 )，1028-1030 
sum-of-products circuits ( 积 之 和 电路 )，1026 
truth tables for ( 真 值 表 )，1026 
Off-by-one errors (数据 访问 错位 )，92 
Offscreen canvas (缓冲 区 画布 )，151 
Offset binary representation ( 偏 移 二 进 制 表 示 )， 
889 
On computable numbers, with anapplication to the 
Entscheidungsproblem article (文章 《可 计算 
数 及 其 在 决策 问题 上 的 应 用 》)，717 
On/off switches (打开 /关闭 开关 )，1005 
One-dimensional arrays (一 维 数组 )，90 
One-hot OR gates( 单 热 或 门 )，1023 
Onscreen canvas (屏幕 画布 )，151 
Opcodes (操作 码 )，911 
Operands (操作 数 )，17 
Operators and operations (操作 符 和 运算 操作 ) 
boolean (布尔 )，26-27, 989-991 
comparisons (比较 )，27-29, 364 
compound assignments (组 合 赋值 )，60 
data types (数据 类 型 )，14, 331 
description (描述 )，15 
expressions (表达 式 )，17, 587 
floating-point numbers( 浮 点 数 )，24 
integers (整数 )，22, 891 
lambda (Lambda), 450 
overloading ( 重 载 )，416 
precedence (优先 级 )，17 
reverse Polish notation ( 反 向 波兰 表示 法 )，590 
stacks ( 栈 )，590 
strings (字符 串 )，19, 21, 334, 453 
TOY machine (TOY 机 )，906 
Optimal data compression( 最 佳 数据 压缩 )，814 
Optimization (优化 ) 
NP problems (NP 问题 )，835 
premature (不 成 熟 的 )，518 
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Optimizing compilers (优化 编译 器 )，814 
OR function (OR 函数 )，987-989 
OR gates (或 门 )，1014, 1023 
Or operation (or 运算 符 ) 
bitwise( 按 位 )，891-892 
boolean type (布尔 类 型 )，26-27 
TOY machine (TOY 机 )，913 
Order in BSTs (二 又 搜索 树 中 的 有 序 操作 ) 640， 
642—643 
Order statistics( 层 序 统 计 )，651 
Order-of-growth classifications (增长 量 级 分 类 ) 
constant (常数 )，503 
cubic (立方 )，505-508 
exponential (指数 )，505-508 
linear (线性 )，504-505, 507-508 
linearithmic (线性 对 数 )，504-505, 507-508 
logarithmic (对 数 )，503 
overview (概述 )，503 
performance analysis (性 能 分 析 ),，500-501 
quadratic (二 次 )，504-505, 507-508 
Ordered operations (有 序 操作 ) 
binary search trees (二 叉 搜 索 树 )，651 
symbol tables (符号 表 )，624 
Orphaned objects (孤立 对 象 )，366 
Orphaned stack items (孤立 的 堆栈 项 )，581 
Out library (out 库 )，355-356 
Onuter loops (外 循环 )，62 
Onutline shapes (图 形 的 描 边 )，149 
Output (输出 ) 
arithmetic logic units (算术 逻辑 单元 )，1032 
array libraries (数组 库 )，237-238 
circuit models (电路 模型 )，1002-1004 
clocks (时钟 )，1059-1060 
data types (数据 类 型 )，353 
file concatenation (文件 连接 )，356 
gates《〈 门 )，1013 
machine language( 机 器 语言 )，934-936 
print statements (打印 语句 )，8 
printf() method (printf() 方法 )，126-129 
standard (标准 )，127, 129-132 
standard audio (标准 音频 )，155-159 
standard drawing (标准 绘图 ) 
stream data types ( 流 式 数 据 类 型 )，355 
two-dimensional arrays (二 维 数组 )，107 


virtual machines (虚拟 机 )，969-970 
Overflow (溢出 ) 

arithmetic (算术 )，885 

arrays (数组 )，95 

attacks (攻击)，963 

guarding against (防御 )，898 

integers (整数 )，23 

negative numbers (负数 )，38 
Overhead for objects (对 象 的 开销 )，514 
Overloading (超载 ) 

operators (运算 符 )，416 

static methods (静态 方法 )，198 
Overriding methods ( 重 写 方法 )，452 


P 


The P= NP Question and Gédel’s Lost Letter book 
(P = NP 问题 和 哥 尔 德 丢失 的 信件 )，856 
P search problems (P 搜索 问题 )，837 
examples (示例 )，839 
main question( 主 问题 )，840-841 
Padding object memory (填充 对 象 存储 器 )，514 
Page, Lawrence (劳伦斯 ， 佩 奇 )，184 
Page ranks (页 面 排名 )，176-177 
Palindromes ( 回 文 ) 
description (描述 )，719 
Watson-Crick( 沃 森 - 克 里 克 )，374 
Paper size (纸张 大小)，294 
Paper tape( 纸 带 ); 934-938 
Papert, Seymour (西蒙 派 珀 特 )，400 
Parallel arrays (平行 数组 )，411 
Parallel edges (平行 边 )，676 
Parameter Variables (参数 变量 ) 
lambda expressions (Lambda 表达 式 )，450 
static methods (静态 方法 )，196-197, 207 
Parameterized data types (参数 化 数据 类 型 )，582-586 
Parameters (参数 ) 
in performance (性 能 )，511 
TOY-8 machine (TOY-8 计算 机 )，1070 
Parentheses () 
casts (转型 )，33 
constructors (构造 函数 )，333, 385 
expressions (表达 式 )，17, 27 
functions (也 数 )，24, 197 
lambda expressions (Lambda 表达 式 )，450 
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methods (方法 )，30, 196 
operator precedence (运算 符 优先 级 )，17 
regular expressions (正则 表达 式 )，724 
stacks ( 栈 )，587, 590 
static methods (静态 方法 )，196 
vectors (向 量 ), 442 
Parity in ripple-carry adders (进位 加 法 器 中 的 奇 
偶 校 验 )，1028 
Parsing (解析 ) 
instructions (指令 )，966-967 
strings (字符 串 )，880-882 
Pascal’s triangle (帕斯卡 三 角形 )，125 
Passing arguments (传递 参数 ) 
references by value ( 值 引用 )，364-365 
static methods (静态 方法 )，207-210 
PathFinder program (程序 PathFinder)，683-686, 
690-692 
Paths (路 径 ) 
graphs (图 )，674, 683-692 
intractability problems( 难 以 解决 的 问题 )，829 
shortest (最 短 ) 
simple (简单 )，710 
Pattern class for REs (RE 的 Pattern 类 )，763 
PCs 
PDA (pushdown automata)( 下 推 自动 机 )，755-756 
PDP-8 computers (PDP-8 计算 机 )，906 
Peaks in terrain analysis (地 形 分 析 中 的 峰值 )，167 
Pell’s equation( 佩 尔 方 程 ), “869 
Pens ( 笔 ) 
color (颜色 )，150 
drawings (绘图 )，146 
Pepys, Samuel ( 塞 缪 尔 . 佩 皮 斯 )，88 
Pepys problem ( 佩 皮 斯 问题 )，88 
Percent signs (%)( 百 分 号 ) 
conversion codes (转换 代码 )，131-132 
remainder operation( 求 余 运算 符 )，22-23 
Percolation case study (渗透 案例 研究 ) 
adaptive plots ( 自 适 应 绘图 )，314-318 
lessons (经 验 总 结 )，318-320 
overview (概述 )，300-301 
Percolation, 303-304 
PercolationPlot, 315-317 
PercolationProbability,310=311 
PercolationVisualizer,308-309 


probability estimates (概率 估计 )，310-311 
recursive solution (递归 解决 方案 )，312-314 
scaffolding (脚手架 )，302-304 
testing (测试 )，305-308 
vertical percolation (垂直 渗透 原理 )，305-=306 
Performance (性能) 
binary search trees (二 叉 搜索 树 )，647-648 
binary searches (二 分 查找 )，535 
caveats (陷阱 )，509-511 
comparing (比较 )，508-509 
guarantees (保障 )，512, 627 
hypotheses (假设 )，496-502 
importance (重要 性 )，702 
insertion sorts (插入 排序 )，544-545 
memory use (内 存 使 用 )，513-517 
mergesort (归并 排序 )，553 
multiple parameters (多 个 参数 )，511 
order of growth (增长 量 级 )，503-506 
overview (概述 )，494-495 
perspective (展望 )，518 
prediction (预测)，507-509 
scientific method (科学 方法 )，495-502 
shortest paths (最 短路 径 )，690 
wrapper types (封装 类 型 )，369 
Performer program (程序 Performer), 697-699 
Periods (.) 
classes (类 )，227 
regular expressions (正则 表达 式 )，724 
Permutations (排列 ) 
inverse( 反 向 )，122 
sampling (抽样 )，97-99 
Phase transitions ( 相 变 )，317 
Phone books (电话 每 )，628 
Photographs (照片 )，346 
Physical systems, graphs for (物理 系统 图 表 )，672 
Pi constant (pi 常量 )，31-32 
Picture library (Picture 库 )，346-347 
Piecewise approximation (分 段 近似 )，148 
Pigeonhole principle ( 铝 笼 原理 )，754-755 
Piping (管道 ) 
connecting programs (连接 程序 )，141 
filters (过 滤器 )，142-143 
Pixels in image processing (图 像 处 理 中 的 像素 )， 
346 


Plasma clouds (等 离子 体 云 )，280 
Playing card possibilities (纸牌 游戏 可 能 性 )，823 
PlayThatTune program (程序 PlayThatTune); 157= 
158 
PlayThatTuneDeluxe program (程序 PlayThatTune- 
Deluxe)，213-215 
PlotFilter program (程序 PlotFilter)，146-147 
Plotting (绘图 ) 
array values (数组 值 )，246-248 
experimental results (实验 结果 )，249-250 
function graphs (函数 图 形 )，148, 248 
percolation case study (渗透 案例 研究 )，314- 
318 
sound waves (声波 )，249 
Plus signs (+) 
compound assignments (组 合 赋值 )，60 
floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22 
regular expressions (正则 表达 式 )，731 
string concatenation (字符 串 拼 接 )，19-20 
Pointers (指针 ) 
array elements (数组 元 素 )，94 
handles (句柄 )，371 
object references (对 象 引 用 )，338 
safe (安全 )， 366 
Poisson processes( 泊 松 过 程 )，597 
Polar coordinates( 极 坐标 )，47 
Polar representation( 极 坐标 表示 )，433-434 
Polling, statistical (统计 投票 )，167 
Polymorphism (多 态 性 )，448 
Polynomial time (多 项 式 时 间 )，823 
Polynomial-time algorithms (多 项 式 时 间 算 法 ) 
intractability ( 难 解 性 )，825-826 
P search problems (P 搜索 问题 )，837, 839 
usefulness (有 用 )，858 
Polynomial-time reductions (多 项 式 时 间 归 约 )， 
841-843 
Pop operation (出 栈 操 作 ) 
reverse Polish notation《〈 反 向 波兰 表示 法 )，590-591 
in stacks( 栈 中 )，567-568 
Positional notation (位 置 表示 )，875 
Post, Emil (邮件 )，813-814 
Post correspondence problem (邮寄 通信 问题 )，813- 
814 
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467 
Postfix notation (后 缀 表示 法 )，590 
Postorder tree traversal (后 序 树 遍历 )，649 
PostScript language (PostScript 语言 )，400, 590 
PotentialGene program (程序 PotentialGene)，336- 
337 
Pound signs (#), 769 
Power method ( 乘 罕 方 法 )，180-181 
Power source (电源 )，1003-1004 
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58 
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regular expressions (正则 表达 式 )，724 
Precision (精度 ) 
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printf(), 130=131 
standard output (标准 输出 )，129-130 
Precomputed array values( 预 计算 的 数组 值 )，99= 
100 
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Preorder tree traversal (前 序 树 遍 历 ) 649 
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Prime numbers (质数 ) 
in factoring (因数 )，72-73 
Sieve of Eratosthenes ( 埃 拉 托 斯 特 尼 筛 法 )， 
103-105 
PrimeSieve program (程序 PrimeSieve)，103-105 
Primitive data types (基本 数据 类 型 )，14 
memory size (内 存 大 小 )，513 
overflow checking (溢出 检查 )，39 
performance (性 能 )，369 
wrappers (封装 )，457 
Principle of superposition ( 闪 加 原理 )，483 
print() method (print() 方法 )，31 
arrays (数组 )，237-238 
impurity (杂项 )，32 
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Out, 355 
vs. println() (对 比 println()),，8 
standard output (标准 输出 )，129-130 
Print statements (打印 语句 ),，5 
printf() method (printf() 方 法 )，129-132, 355 
Printing; formatted (格式 化 打印 )，130-132 
println() method (printin() 方法 )，31 
description (描述 )，5 
impurity (杂项 )，32 
Out, 355 
Vs. print() (对 比 print())，8 
standard output (标准 输出 )，129-130 
string concatenation (字符 串 拼 接 )，20 
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access modifier (访问 修饰 符 )，384 
encapsulation (封装 )，433 
Probabilities (概率 ),，308, 310=311 
Probability density function (概率 密度 函数 )，202 
203 
Problem reduction (问题 归 约 ) 
overview (概述 )，811 
program equivalence (等 价 程序 )，812 
Rice’s theorem ( 莱 斯 定理 )，812-813 
totality problem (总 和 问题 )，811-812 
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处 理性 )，824 
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bus connections (总 线 连接 )，1073-1074 
connections and timing (连接 与 计时 )，1075 
control lines (控制 线 )，1074-1075 
interfaces (接口 )，1073 
modules (模块 )，1073 
overview (概述 )，1073 
TOY machine (TOY 机 )，910 
Program equivalence problem (程序 等 价 问题 )，812 
Program size (程序 大 小 )，252-253 
Programming environments (编程 环境 )，1094 
Programming languages (编程 语言 ) 
indexing (索引 )，634 
stack-based (基于 栈 )，590 
symbol tables (符号 表 )，629 
Programming overview (编程 概述 )，1 
HelloWorld example (HelloWorld 示例 )，4-6 


input and output (输入 和 输出 )，7-8 
process (人 处理)，2-3 
Programs (程序 ) 
connecting (连接 )，141 
processing programs (处 理 程 序 )，788-790, 964- 
966 
Proof by contradiction (矛盾 证 明 )，754 
Pseudo-code( 伪 代码 )，911 
public keyword (public 关键 字 ) 
access modifiers (访问 修饰 符 )，384 
description (描述 )，228 
static methods (静态 方法 )，196 
Pulses, clock (脉冲 时 钟 )，1058 
Punched cards ( 打 孔 卡 )，940 
Punched paper tape( 打 孔 纸 带 )，934-938 
Pure functions( 纯 函数 ), :201 
Pure methods( 纯 方法 )，32 
Push operation (入 栈 操作 ) 
reverse Polish notation ( 反 向 波兰 表示 法 ), 590- 
591 
stacks( 栈 )，567-568 
Pushbuttons for TOY machine (TOY 机 的 按钮 )， 
916 
Pushdown automata (下 推 自动 机 )，755-756 
Pushdown stacks (下 推 栈 )，567-568 
Put operations (Put 操作 ) 
hash tables( 散 列表 )，639 
symbol tables (符号 表 )，624 
Putnam, Hilary (希拉 里 : 普 特 南 )，816 
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Quadratic order of growth (二 次 型 增长 量 级 )， 
504—505, 507-—508 
Quadratic program (程序 Quadratic )，25-26 
Quadrature integration ( 正 交 积分 )，449 
Quaternions( 四 元 数 )，424 
Question marks (?) in REs (正则 表达 式 中 的 问号 )， 
731 
Questions program (程序 Questions)，533-535 
Queue program (程序 Queue)，592-596, 604-605 
Queues (队列 ) 
circular (环形 )，620 


deques ( 双 端 队列 )，618 

FIFO (先进 先 出 ) 

overview (概述 )，566 

random (随机 )，596 

summary (总 结 )，608 
Queuing theory (排队 论 )，597-600 
Quotes (") in text (文本 中 的 引号 )，5 
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Race conditions in flip-flops (触发 器 竞争 条 件 )， 
1050 
Ragged arrays (交错 数组 )，111 
Ramanujan, Srinivasa (斯 里 尼 瓦 瑟 . 拉 马 努 金 )，86 
Ramanujan’s taxi( 拉 马 努 金 的 出 租车 问题 )，86 
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Random numbers (随机 数 ) 
fair coin flips (公平 硬币 翻转 )，52-53 
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impurity (杂项 )，32 
libraries ( 库 )，232-236 
random sequences( 随 机 序列 )，127-128 
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240 
simulations (模拟 )，72-73 
Math.random()，30-31 
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Random walks( 随 机 游 走 ) 
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self-avoiding ( 自 回避 )，112-115 
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Random web surfer case study (随机 网 络 冲浪 案例 
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input format (输入 格式 )，171 
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Markov chains (马尔 可 夫 链 ) 176, 179-184 
overview (概述 )，170-171 
page ranks (页 面 排名 )，176-177 
simulation (模拟 )，174-178 
transition matrices ( 转 置 矩阵 )，172-173 
RandomInt program (程序 RandomInt)，33-34 
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RandomSeq program (程序 RandomSeq)，127-128 
RandomSurfer program (程序 RandomSurfer)，175 
及 和 
RangeFilter program (程序 RangeFilter)，140-143 
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binary search trees (二 叉 搜 索 树 ), 651 
functions (函数 )，192 
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binary search trees (二 又 搜索 树 )，651 
random web surfer( 随 机 网 上 冲浪 )，176=177 
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992 
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Recurrence relations (递归 关系 ),，272 
Recursion (递归 )，191 
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Euclid’s algorithm ( 欧 几 里 得 算法 )，267-268 
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mathematical induction (数学 归纳 法 )，266 
memory requirements (内 存 要求 )，282 
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perspective (展望 )，289 
pitfalls (陷阱 )，281-283 
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Redirection ( 重 定向 )，139 
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standard output (标准 输出 )，139-140 
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overview (概述 )，1051-1052 
TOY machine (TOY 机 )，909, 911 
writing to〈 写 人 )，1052-1053 
Regular expressions (RE， 正 则 表达 式 ) 
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Rice’s theorem ( 莱 斯 定理 )，812-813 
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Safe pointers (安全 指针 )，366 
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Scientific notation (科学 计数 法 ) 
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TSP problem (TSP 问题 )，862 


vertex cover problem (顶点 覆盖 问题 )， 834， 
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112-115$ 
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for loops (for 循环 )，59 
statements (语句 )，5 
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clocks〈 时 钟 )，1058-1061 
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feedback circuits (回馈 电路 )，1048-1049 
flip-flops〈 触 发 器 )，1049-1050 
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overview (概述 )，1048 
registers (寄存 器 )，1051-1053 
summary (总 结 )，1062-1063 
Sequential searches (顺序 查找 )，535-536 
Server farms( 服 务 器 农场 )，976 
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Shortest paths (最 短路 径 ) 
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breadth-first searches (广度 优先 搜索 )，690 
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Sieve of Eratosthenes《〈 埃 拉 托 斯 特 尼 筛 法 )，103-- 
105 

Sign-and-magnitude (符号 加 数值 表示 法 )，886 
Sign extension convention (符号 扩展 转换 )，899 
Signatures( 签 名) 

constructors (构造 函数 )，385 

methods (方法 )，30, 196 

overloading (超载 )，198 
Similarity measures (相似 性 度量 )，462 
Simple paths (简单 路 径 )，710 
Simplex method (单纯 形 方 法 )，831 
Simulations (模拟 ) 

coupon collector( 卡 券 收集 器 )，174-178 

dice( 般 子 )，121 

gambler’s ruin( 赌 徒 破产 )，69-71 

Let’s Make a Deal, 88—89 

load balancing (负载 均衡 )，606-607 

M/M/1 queues(M/M/1 队列 )，598-600 

Monte Carlo (蒙特 卡 洛 )，300, 307-308 

n-body (多 体 ) 

random web surfer (随机 网 络 冲浪 )，174-178 
Single-line comments (单行 注释 )，5 
Singles quotes(')( 单 引号 )，19 
Singly linked lists ( 单 链表 )，571 
Sipser, Michael (迈克 尔 ， 西 普 塞 )，780 
Six degrees of separation( 六 度 分 隔 )，670 
Size (规模 大 小 ) 

arrays (数组 )，578-581, 635 

binary search trees (二 又 搜索 树 )，651 

modules (模块 )，319 

paper ( 纸 带 )，294 

problems (问题 )，495, 824 

program (程序 )，252-253 

symbol tables (符号 表 )，624 

words (单词 )，874, 897 
Sketch program (程序 Sketch)，459-462 
Sketches (文档 摘要 ) 

comparing (比较 )，462-463 

computing (计算 )，459-460 

hashing ( 散 列 )，460 

overview【( 概 述 )，458-459 
Slashes (/) 

comments (注释 )，5 
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floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22-23 
Slide rules ( 算 尺 )，907-908 
Small-world case study (小 世界 案例 研究 ) 
Small-world phenomenon (小 世界 现象 )，670,693 
SmallWorld program (程序 SmallWorld),696 
Smith-Waterman algorithm( 史 密斯. 沃 特 曼 算法 ); 
286 
Social network graphs (社交 网 络 图 )，672 
Sorts (排序 ) 
Arrays.sort(), 559 
frequency counts (频率 计数 器 )，555-557 
insertion (插入 )，543-549 
lessons (经 验 总 结 )，558 
mergesort( 归 并 排序 )，550-555 
overview (概述 )，532 
P search problems (P 搜索 问题 )，839 
Sound (声音 ) 
Sound waves (声波 ) 
plotting (绘图 )，249 
superposition of (又 加 )，211-215 
Source vertices( 源 顶点 )，683 
Space-filling curves (空间 填充 曲线 ); 425 
Spaces (空间 ),，10 
Space-time tradeoff (时 间 和 空间 的 折 中 ),，99-100 
Sparse matrices( 稀 玖 和 矩阵)，666 
Sparse small-world graphs ( 稀 朴 小 世界 图 )，693 
Sparse vectors ( 稀 玻 向 量 )，666 
Spatial vectors (空间 向 量 )，442-445 
Specification problem (规范 问题 ) 
APIs (应 用 程序 编程 接口 )，430 
formal languages (形式 语言 )，722 
programs (程序 )，596 
Speed (速度 ) 
clocks〈 时 钟 )，1058 
in performance (性 能 )，507-508 
Spider traps (蜘蛛 陷阱 )，176 
Spira mirabilis (等 角 螺 线 )，398 
Spiral program (程序 Spiral)，398-399 
Spirographs (螺旋 体 )，167 
Split program (程序 Split)，358, 360 
Spreadsheets (电子 表格 )，108 
Sqrt program (程序 Sqrt)，65-67 
Square brackets ([]) 
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arrays( 数 组)，91, 106 
regular expressions (正则 表达 式 )，731 
Square roots (平方 根 ) 
computing (计算 )，65-67 
double value( 双 值 )，25 
Squares, Albers (阿尔 伯 斯 方块 )，341-342 
Squaring Markov chains (马尔 可 夫 链 自 乘 )，179- 
180 
SR flip-flops (SR 触发 器 )，1050 
ST library (ST 库 )，625-627 
Stable circuits with feedback (含有 反馈 的 稳定 电 
路 ),，1049 
Stack program (程序 Stack)， 583-585 
StackOfStrings program (程序 StackOfStrings)，568 
StackOverflowError 282 
Stacks ( 栈 ) 
arithmetic expressionevaluation (算术 表达 式 计 
算 )，586-589 
arrays (数组 )，568-570, 578-581 
function calls (函数 调用 )，590-591 
linked lists (链表 )，574=576 
overview (概述 )，566 
parameterized types (参数 化 类 型 )，582-586 
pushdown (入 栈 )，567-568 
stack-based languages (基于 栈 的 语言 )，590 
summary (总 结 )，608 
Standard audio( 标 准 音 频 ) 
concert A, 155 
description (描述 )，126, 128-129 
music example (音乐 示例 )，157-158 
notes (注释 )，156 
overview (概述 )，155 
sampling (采样 )，156-157 
saving files (保存 文件 )，157 
summary (总 结 )，159 
Standard deviation (标准 差 )，246 
Standard drawing (标准 绘图 ) 
control commands (控制 命令 )，145=146 
description (描述 )，126, 128-129 
double buffering( 双 缓冲 区 )，151 
filtering data to (过滤 数据 )，146-147 
function graphs (函数 图 )，148 
outline and filled shapes (轮廓 和 填充 形状 )，149 
overview (概述 )，144-145 


summary (总 结 )，159 
text and color( 文 本 和 颜色 )，150 
Standard input (标准 输入 ) 
arbitrary size (任意 尺寸 )，137-138 
description (描述 )，126, 128-129 
formatted (格式 化 )，135 
interactive (交互 式 )，135-136 
machine language (机 器 语言 )，936-938 
multiple streams (多 个 流 )，143 
overview (概述 )，132-133 
redirecting ( 重 定向 )，140-141 
summary (总 结 )，159 
typing (键入 )，134 
virtual machines (虚拟 机 )，969=970 
Standard output (标准 输出 ) 
description (描述 )，127 
formatted (格式 化 )，130-132 
machine language(〈 机 器 语言 )，934-936 
multiple streams (多 个 流 )，143 
overview (概述 )，129-130 
piping (管道 )，141-143 
redirecting ( 重 定向 )，139-140 
summary (总 结 )，159 
virtual machines (虚拟 机 )，969-970 
Standard statistics (标准 统计 )(b)，244-250 
Standards, API (标准 API)，429 
Start codons (起 始 密 码 子 )，336 
Statements (语句 ) 
assignment( 赋 值 )，17 
blocks ( 块 )，50 
declaration (声明 )，15-16 
methods (方法 )，5 
States (状态 ) 
DFAs (确定 有 限 状态 自动 机 )，738-739 
NFAs ( 非 确 定 有 限 状 态 自动 机 )，744-746 
objects (对 象 )，340 
Turing machines (图 灵机 )，766-772 
virtual machines (虚拟 机 )，968 
Static methods (静态 方法 )，191-192 
accessing (访问 )，227-229 
arguments (参数 )，197 
for code organization (代码 组 织 )，205-206 
control flow (控制 流 )，193-195 
defining (定义 )，193, 196 


function-call traces ( 函数 调用 跟踪 )，195 
function calls (函数 调用 )，197 
implementation examples (实现 示例 )，199 
vs. instance (对 比 实例 )，340 
libraries ( 库 )，198 
passing arguments (传递 参数 )，207-210 
returning values (返回 值 ),，207-210 
Side effects (副作用 )，201 
summary (总 结 )，215 
superposition example (至 加 例子 )，211-215 
terminology (术语 )，195-196 
variable scope (变量 作用 域 )，200 
Static variables (静态 变量 )，284 
Statistical polling (统计 调查 )，167 
Statistics (统计 ) 244-250 
StdArrayIO library (StdArrayIO 库 )，237-238 
StdAudio library (StdAudio 库 )，128-129, 155 
StdDraw library (StdDraw 库 )，128-129,144--145， 
150, 154 
StdIn library (StdIn 库 )，128-129, 132-133 
StdOut library (StdOut 库 )，129-131 
StdRandom program (程序 StdRandom)，232-236 
StdStats program (程序 StdStats)，244-247 
StockAccount program (程序 StockAccount)，410- 
413 
StockQuote program (程序 StockQuote)，358-359 
Stop codons (终止 密码 子 )，336 
Stopwatch program (程序 Stopwatch)，390-391 
Store instruction (存储 指令 )，938, 1080 
Stored-program computers (存储 程序 计算 机 )， 
922-924 
Streams ( 流 ) 
input (输入 )，354-355 
output (输出 )，355 
screen scraping (屏幕 抓 取 )，357-359 
Stress testing (压力 测试 )，236 
Strings and String data type (字符 串 与 字符 串 数据 
类 型 ) 
alphabet symbols (字母 符号 )，718 
API (应 用 程序 编程 接口 )，332-333 
binary (二 进 制 )，718-719 
circular shifts (循环 移 位 )，375 
concatenation (拼接 )，19-20, 723-724 
conversion codes (转换 代码 )，131-132 
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conversions (转换 )，21, 453 
description (描述 )，14-15 
genomics application (基因 组 学 应 用 )，336-340 
immutable types (不 可 变 类 型 )，439-440 
input (输入 )，133 
internal storage (内 部 存储 )，37 
invoking instance methods (调用 实例 方法 )，334 
memory (内 存 )，515 
objects (对 象 )，333-334 
overview (概述 )，331 
parsing (解析 )，880-882 
prefix-free (无 前 级 )，564 
representation (表示 )，882-883 
as sequence of characters (字符 串 序列 )，19 
shortcuts (捷径 )，334-335 
string replacement systems (字符 串 替 换 系 统 )， 
795 
unions (并 集 )，723 
variables (变量 )，333 
vertices (顶点 )，675 
working with (共同 作用 )，19-21 
Strogatz, Stephen (史蒂芬 * 斯 特 罗 格 次 )，670， 
693, 713 
Structured programming (结构 化 编程 )，926 
Stub methods (存根 方法 )，303 
Subclassing inheritance( 子 类 继承 )，452-457 
Subgraphs, induced (诱导 子 图 )，705 
Subset sum problem ( 子 集 和 问题 ) 
intractability ( 难 解 性 )，827-828 
NP, 834, 838 
Subtraction (减法 ) 
floating-point numbers ( 浮 点 数 )，24-26 
integers (整数 )，22 
negative numbers (负数 )，887 
Subtrees( 子 树 )，640, 651 
Subtyping inheritance ( 子 类 型 继承 )，446-451 
Sum-of-powers conjecture ( 宕 和 猜想 )，89 
Sum-of-products ( 积 之 和 ) 
adders (加 法 器 )，1028 
boolean representation (布尔 表示 )，996=-997 
circuits (电路 )，1024-1027 
Sums, finite (有 限 和 )，64-65 
Superclasses ( 超 类 )，452 
Superposition ( 丢 加 ) 
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force vectors( 力 向 量 )，483 
sound waves (声波 )，211-215 
Swirl filters〈 游 涡 过 滤器 )，379 
Switch control lines (开关 控制 线 )，1005 
Switch statements (开关 语句 )，74-75 
Switches (切换 ) 
bus muxes (总 线 多 路 复 用 器 )，1036 
circuit models (电路 模型 )，1002, 1005-1006 
demultiplexers (多 路 分 配器 )，1022 
gates ( 门 ),，1013 
multiplexers (多 路 复 用 器 )，1020 
TOY machine (TOY 机 )，916-917 
Switching circuit analysis (开关 电路 分 析 )，1007 
Switching time of gates( 门 的 切换 时 间 )，1013 
Symbol tables (符号 表 ) 
APIs (应 用 程序 编程 接口 )，625-627 
BSTs (二 又 搜索 树 ) 
dictionary lookup (字典 查找 )，628-632 
graphs (图 )，676 
hash tables( 散 列表 )，636-639 
implementations (实现 )，635-636 
indexing (索引 )，632-634 
machine language (机 器 语言 )，944 
overview (概述 )，624-625 
perspective (展望 )，654 
sets (集合 )，652-653 
Symbolic names in assembly (汇编 语言 的 符号 名 
称 )，981 
Symbols (符号 ) 
definition (定义 )，757 
description (描述 )，718-719 
DFA (确定 有 限 状 态 自动 机 )，738 
NFA ( 非 确定 有 限 状 态 自动 机 )，744 
regular expressions (正则 表达 式 ),724 
Turing machines (图 灵机 ),，766-767 
Symmetric order in BSTs ( BST 中 的 对 称 顺 序 ); 
640 
Symmetric property (对 称 属性 )，454 
Syntax errors( 语 法 错误 )，10-11 


T 


Tables ( 表 ) 
of functions (函数 )，907-908 


hash ( 散 列 )，636-639 
symbol (符号 ) 
Tabs( 制 表 符 ) 
compiler considerations (编译 考虑 )，10 
escape sequences ( 转 义 序列 )，19 
Tape and tape readers( 纸 带 和 纸 带 阅 读 器 ) 
DFAs (确定 有 限 状 态 自动 机 )，738-739 
Turing machines (图 灵机 )，766-769,774-776 
Tape program (程序 Tape)，776 
Taylor series approximations (泰勒 级 数 近似 值 )， 
204 
Templates (模板 )，50 
TenHellos program (程序 TenHellos);，54-55, 60 
Terminal windows (终端 窗口 )，127 
Terms, glossary for (术语 表 )，1097-1101 
Terrain analysis (地 形 分 析 )，167 
Testing (测试 ) 
for bugs (错误 )，318 
importance (重要 性 )，701 
percolation case study (渗透 案例 研究 )，305-308 
Text (文本 ) 
drawings( 绘 图)，150 
printing (打印 )，5, 10 
Text editors (文本 编辑 器 )，3 
Theory of computing (计算 理论 )，715-717 
this keyword (this 关键 字 )，445 
Thompson, Ken ( 肯 … 汤普森 )，735 
3n+1 problem ( 3n+1 问题 )，296-297 
ThreeSum program (程序 ThreeSum)，497-502 
Throwing exceptions( 抛 出 异常 )，465-466 
Thue word problem (图 厄 词 问题 )，819 
Ticks, clock (时 钟 )，1058 
Tilde notation (波浪 线 表示 法 )，500 
Tildes (~) 
bitwise operations( 按 位 运算 )，891 
boolean type (布尔 类 型 )，991 
frequency analysis (频率 分 析 )，500 
Time (时 间 ) 
exponential (指数 )，272-273, 823 
performance (性 能 ) 
polynomial (多 项 式 )，823 
Stopwatch timers (秒表 计时 器 )，390-391 
TimePrimitives program (程序 TimePrimitives)，519 
Timesharing (分 时 操作 )，965 


Tools, building (构建 工具 )，320 
Top-level domains (顶级 域名 )，375 
toString() method (方法 toString()) 
Charge, 383, 387 
Color, 343 
Complex, 403, 405 
Convert, 881—882 
Counter, 436—437 
description (描述 )，339 
Graph, 678-679 
linked lists (链表 )，574, 577 
Object, 453 
Sketch, 459 
Tape, 776 
Vector, 443 
Total orderings (全 序 )，546 
Totality problem (总 体 问题 )，811-812 
Towers of Hanoi problem ( 汉 诺 塔 问题 )，268-272 
TOY machine (TOY 机 ) 
arithmetic logic unit (算术 逻辑 单元 )，910 
conditionals and loops (条件 和 循环 )，918-921 
family of computers (计算 机 系列 )，972-977 
fetch-increment-execute cycle ( 取 指 - 增 量 - 
执行 周期 )，910-911 
first program (第 一 个 程序 )，914-915 
historical note( 历 史记 录 )，907-908 
instruction register (指令 寄存 器 )，910 
instructions (指令 )，909, 911-913 
in Java (Java 中 )，966-972 
machine-language programming (机 器 语言 编程 ) 
memory (内存 )，908-909 
operating (操作 )，916-917 
overview (概述 )，906-907 
program counter (程序 计数 器 )，910 
registers (寄存 器 )，909 
stored-program computer (存储 程序 计算 机 )， 
922-924 
virtual (虚拟 ) 
von Neumann machines ( 汉 。 诺 依 曼 计算 机 )， 
924-925 
TOY program (程序 TOY)，967 
TOY-8 machine (TOY-8 计算 机 )，974-975 
basic parameters (基本 参数 )，1070 
control circuit (控制 电路 )，1080-1082 
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CPU (中 央 处 理 器 )，1076-1080 

instruction set (指令 集 )，1070-1071 

perspective (展望 )，1084-1087 

sum.toy program (程序 sum.toy)，1071-1072， 

1082-1083 

TOY-64 machine (TOY-64 计算 机 )，973-974 
Tracing (追踪 ) 

function-call (函数 调用 )，195 

programs with random() (程序 random())，103 

variable values (变量 值 )，18, 56-57 
Transfer of control (转换 控制 )，193-195 
Transistors (晶体 管 )，1006 
Transition matrices (转换 矩阵 )，172-173 
Transition program (程序 Transition)，172-173 
Transitions (转移 ) 

DFAs (确定 有 限 状 态 自 动机 )，738-739 

NFAs ( 非 确 定 有 限 状 态 自 动机 )，744-746 

Turing machines (图 灵机 )，766-767 
Transitive property (传递 性 ) 

comparisons (比较 )，546 

equivalence (等 价 )，454 

polynomial-time reduction (多 项 式 时 间 归 约 )， 

843 

Transposition of arrays (数组 的 转 置 )，120 
Traveling salesperson problem (旅行 商 问 题 )，862 
Traversal (遍历 ) 

binary search trees (二 又 搜索 树 )，649-650 

linked lists (链表 )，574, 577 
TreeMap library (TreeMap 库 )，655 
Tree nodes(〈 树 节点 )，269 
Trees ( 树 ) 

BSTs (二 又 搜索 树 ) 

function-call (函数 调用 )，269, 271 

H-trees (H 树 )，276-277 

shortest paths (最 短路 径 )，688-689 
Triangles (三 角形 ) 

drawing (绘图 )，144-145 

right (直角 )，199 

Sierpinski( 谢 尔 宾 斯 基 )，239-240 
Trigonometric functions (三 角 函 数 )，256 
Truth tables〈 真 值 表 )，26-27, 988-989 
TSP problem (TSP 问题 )，862 
Turing, Alan ( 艾 伦 * 图 灵 ) 766 

bio (简历 )，410-411, 717 
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code breaking (代码 破 坏 )，907 


von Neumann influenced by ( 冯 ，… 诺 依 曼 的 影响 


者 )，924-925 
Turing-complete models (图 灵 完 全 模型 )，794 
Turing machines (图 灵机 ) 
binary adders (二 进 制 加 法 器 )，771 
binary incrementers (二 进 制 递增 器 )，769-771 
compact trace format (紧凑 的 跟踪 格式 )，770 
constant factor (常数 因子 )，824 
efficiency (效率 )，772 
frequency count〈 频 率 计 数 器 )，772-773 
model (模型 )，766-769 
overview (概述 )，766 
related machines (关联 机 器 )，770-771 
restrictions (限制)，792-793 
SAT problem (SAT 问题 )，836 
universal (通用 ),，789-790 
universal virtual (通用 虚拟 )，774-779 
universal virtual DFAs (通用 虚拟 DFA)，789 
universality (普遍 性 ) 
variations (变量 )，791-794 
TuringMachine program (程序 TuringMachine)， 
777-778 
Turtle program (程序 Turtle)，394-396 


Twenty questions game (20 个 问题 游戏 )，135- 


136, 533—535 
TwentyQuestions program( 程 序 TwentyQuestions)， 
135—136 
Two-dimensional arrays (二 维 数 组 ) 
description (描述 )，90 
initialization (初始 化 )，106-107 
matrices (和 矩阵 )，109-110 
memory (内 存 )，107, 516 
output (输出 )，107 
overview【〈 概 述 )，106 
ragged (交错 )，111 
self-avoiding walks ( 自 回避 行走 )，112=-115 
setting values( 设 定 值 )，108 
spreadsheets (电子 表 格 )，108 
Two”s complement (二 进 制 补 码 )，38, 886-888 
Type arguments (类 型 参数 )，585, 611 
Type conversions (类 型 转换 )，34-35 
Type parameters (类 型 参数 )，585 
Type safety (类 型 安全 )，18 


Types (类 型 ) 


U 


Unboxing ( 拆 箱 )，457, 585-586 
Undirected graphs (无 向 图 )，675 
Unicode characters (Unicode 字符 ) 
description (描述 )，19 
overview (概述 )，894-895 
strings (字符 串 )，37 
Uniform random numbers (统一 随机 数 )，199 
Uninitialized variables (未 初始 化 的 变量 )，94, 339 
Union operation in REs (正则 表达 式 中 的 交集 操 
必 ); *723 
Unit testing (单元 测试 )，235 
Universal models (通用 模型 )，794-797 
Universal sets (通用 集合 ) 
elementary functions (基本 功能 )，1001 
gates ( 门 )，1045 
Universal Turing machines (UTMs)( 通 用 图 灵机 )， 
789-790 
Universal virtual DFAs (通用 虚拟 DFA)，741-743 
Universal virtual TMs (通用 虚拟 TM)，774-779 
Universality (普遍 性 ) 
algorithms (算法 )，786-787 
Church-Turing thesis〈 邢 奇 - 图 灵 论 题 )，790- 
791 
overview (概述 )，786 
programs processing programs (程序 处 理 程 序 )， 
788-790 
Turing machine variations (图 灵机 变量 )，791-794 
universal models (通用 模型 , 794-797 
virtual DFA/NFA (虚拟 DFEA/NFA)，788-789 
Universe program (程序 Universe)，483-487 
Unreachable code error (无 法 访问 的 代码 错误 )，216 
Unsigned integers (无 符号 整数 )，884 
Unsolvability proof (无 法 证 明 )，810 
Unsolvable problems (无 解 问题 )，430 
blank tape halting problem( 空 白 纸 带 停机 问题 )， 
820 
definite integration ( 定 积分 )，816 
description (描述 )，806 
examples (示例 )，815 
halting problem (停机 问题 )，808-810 


A 


Hilbert's 10th problem ( 希 尔 伯 特 十 大 问题 )，816 ”Vector images (向量 图 形 )，346 


implications (影响 )，816-817 Vector program (程序 Vector)，443-445, 515 
liar’s paradox (说谎 者 悖 论 )，807-808 Vectors( 癌 量 ) 
optimal data compression (最 佳 数据 压缩 )，814 arrays (数组 )，92 
optimizing compilers( 优 化 编译 器 )，814 cross products (向 量 积 )，472 
Post correspondence (邮寄 通信 )，813-814 dot products (点 积 )，92, 442-443 
program equivalence (程序 等 价 性 )，812 matrix-vectormultiplication (矩阵 向 量 乘法 )，110 
totality (总 和 )，811-812 n-body simulation (多 体 模 拟 )，479-480 
Upper bounds (上 限 )，825 sparse ( 稀 朴 )，666 
Upscaling in image processing (图 像 处 理 中 的 升 spatial (空间 的 );. 442-445 
级 )，349 vector-matrix multiplication (向 量 - 矩阵 乘法 )， 
UseArgument program (程序 UseArgumen)，7-8 110, 180 


User-defined libraries (用 户 自 定义 模块 )，230 
UTF-8 encoding (UTF-8 编码 )，895 
UTMs, 789-790 


Vertex cover problem (顶点 覆盖 问题 ) 
intractability ( 难 解 性 )，828 
NP-completeness (NP 完全 性 )，846-847 

V NP search problems (NP 搜索 问题 )，834, 842 

Vertical bars (|) 
bitwise operations( 按 位 操作 )，891-892 
boolean type (布尔 类 型 )，26-27, 991 
piping (管道 )，141 
regular expressions (正则 表达 式 )，724 

Vertical OR gates (垂直 或 门 )，1023 

Vertical percolation (垂直 渗透 原理 )，305-306 

Vertices (顶点 ) 
bipartite graphs (二 分 图 )，682 
creating (创建 )，676 
eccentricity (偏心 距 ),，711 
graphs (图 )，671, 674 
isolated (孤立 的 )，703 


Validate program (程序 Validate)，729 
Validity checking (有 效 性 检查 )，732 
Values ( 值 ) 

array (数组 )，95-96 

data types (数据 类 型 )，14, 331 

passing arguments by (传递 参数 )，207, 210, 364- 

365 

precomputed (预先 计 算 )，99-100 

symbol tables (符号 表 )，624-626 
Variables (变量 ) 

assignment statements (赋值 语句 )，17 

boolean (布尔 )，987, 994-997 

compound assignments (组 合 赋值 )，60 


constants (常数 )，16 names (命名 )，675 

description (描述 )，15-16 PathFinder, 683 

initial values (初始 值 ), 415。 String, 675 

inline initialization (内 联 初始 化 )，18 Virtual machines (虚拟 机 ) 

instance (实例 )，384 booting (引导 )，959-960, 968-969 
within methods (在 方法 中 )，196, 386-388 cautions (警告 )，961-963 

names (名 称 )，16 and cloud computing ( 云 计 算 )，924 
scope(〈 作 用 域 )，60, 200 description (描述 )，965 

shadow (影子 )，419 dumping (释放 )，960-961 

static (静态 )，284 instructions (指令 )，966-967 
string (字符 串 )，333 Moore’s law (摩尔 定律 )，971 
tracing values (追踪 值 )，18 overview (概述 )，958-959 


uninitialized (未 初始 化 )，339 program development (程序 发 展 )，970-971 
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programs that process programs( 程 序 处 理 程序 )， 
964-966 
running (运行 )，969 
standard input (标准 输入 )，969-970 
standard output (标准 输出 )，969-970 
states (状态 )，968 
TOY machine family (TOY 计算 机 家 族 )，972- 
977 
universal virtual DFAs (通用 虚拟 DFA )，742 
universal virtual TM (通用 虚拟 TM)，774-779 
Viruses (病毒 )，963 
Viterbi algorithm (维特 比 算法 )，286 
void keyword (void 关键 字 )，201, 216 
Volatility (波动 ) 
Black=-Scholes formula (布莱克 - 斯克 尔 斯 期 权 
2 
Brownian bridges (布朗 桥 )，278, 280 
Von Neumann, John (约翰 . 冯 … 诺 依 曼 )，906 
ballistics tables (弹道 表 )，907 
ENIAC improvements (ENIAC 改进 )，924-925 
G6del letter ( 哥 德 尔 信件 )，840 
mergesort( 归 并 排序 )，554 
Von Neumann architecture ( 冯 ， 诺 依 曼 结构 )， 
790, 906, 924-925 
Voting machine errors (投票 机 错误 )，436 


W 


Walks (行走 ) 
random (随机 )，112-115$, 710 
Watson-Crick palindrome ( Watson-Crick 互补 碱 
基 回 文 )，374 
Watts, Duncan (邓肯 ，: 瓦 茨 )，670, 693, 713 
Watts-Strogatz graph model ( Watts-Strogatz 图 模 
型 )，713 
.wav format (.wav 格式 )，157 
Wave filters (滤波 器 )，379 
Web graphs (Web 图 )，695 
Web pages (网 页 )，170 
indexes searches (索引 查找 )，634 
preferential attachment (首选 链接 )，713 
Weighing objects (物体 称 重 法 )，540-541 


Weighted averages (加权 平均 值 )，120 
Weighted superposition (加 权 芭 加 )，212 
while loops (while 循环 )，53-59 
examples (示例 )，61 
nesting ( 骨 套 )，62 
Whitelists, binary searches for ( 白 名 单 二 分 查找 
法 )，540 
Whitespace characters (空白 字符 ) 
compiler considerations (编译 器 考虑 )，10 
input (输入 )，135 
Wide interfaces( 宽 接口 ) 
APIs( 应 用 程序 编程 接口 )，430 
examples( 示 例 )，610-611 
Wildcard operation in Res (RE 中 的 通配符 操作 )， 
724 
Wiles, Andrew (安德鲁 威 尔 斯 )，722 
Wind chill (风寒 指数 )，47 
Wires (电线 ) 
circuit models (电路 模型 )，1002-1004 
gates ( 门 )，1013 
Word ladders( 词 梯 ),，710 
Words (单词 ) 
binary representation (二 进 制 表示 )，875 
computer (计算 机 )，874 
memory size (内 存 大 小 )，513 
size (规模 大 小 )，897 
Worst-case performance (最 坏 情况 下 的 性 能 ) 
big-O notation (大 O 符 号),，520-521 
binary search trees (二 叉 搜索 树 )，648 
description (描述 )，512 
insertion sort (插入 排序 )，544 
intractability ( 难 解 性 )，825 
NP-completeness (NP 完全 性 )，852 
Wrapper types (包装 类 型 ) 
autoboxing (自动 装 箱 )，585-586 
references (引用 )，369, 457 
Write control lines ( 写 控 制 线 ) 
CPU (中 央 处 理 器 )，1079-1080 
memory bits (内 存 位 )，1056 
register bits (寄存 器 位 )，1051 


X 


XOR circuits ( 异 或 电路 ) 
in arithmetic logic units (算术 逻辑 单元 )，1031 
sum-of-products( 积 之 和 )，1024-1025 
xor (exclusive or) operation ( 异 或 操作 )，891-892， 
913 


这 


Y2K problem (千年 问题 )，435, 976 
Young tableaux ( 杨 氏 和 矩阵 )，530 
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Zero-based indexing ( 零 基 (从 0 开始 ) 索引 )，92 

Zero crossings ( 零 交 叉 点 )，164 

Zero extension convention( 零 扩展 惯例 )，899 

0/1 ILP problem( 0/1ILP 问题 )，831, 835 
NP-completeness (NP 完全 性 )，845-846 
vertex cover problem (顶点 覆盖 问题 )，842 

Zeros, leading (前 面 的 0 )，883 

ZIP codes (邮政 编码 )，435 

Zipf *s law ( 齐 普 夫 定律 )，556 


API 


public class Math 


注 2: 
注 3: 


double abs(double a) a 的 绝对 值 
double max(double a,，double b) a 和 b 中 的 较 大 者 
double min(double a，double b) a 和 b 中 的 较 小 者 


: int、1ong 和 float 类 型 数据 也 可 以 使 用 abs 、max( ) 和 min( ) 方 法 。 


double sin(double theta) theta 的 正弦 值 
double cos(double theta) theta 的 余弦 值 
double tan(double theta) theta 的 正切 值 


角度 以 弧度 表示 。 使 用 toDegrees( ) 和 toRadians( ) 进 行 踊 度 角 度 的 转换 。 
使 用 asin()、acos() 和 atan() 计 算 反 三 角 函 数 。 


double exp(double a) 指数 操作 (ea ) 

double log(double a) 自然 对 数 ( log. a 或 者 In a ) 

double pow(double a，double b) ”计算 a 的 b 次 和 (ab ( 
long round(double a) 将 a 向 下 取 整 

double random() [0,- 了 1D) 范围 内 的 一 个 随机 值 

double sqrt(double a) a 的 平方 根 

double E 欧 拉 数 e 的 值 (常量 ) 


double PI 7 的 值 (常量 ) 


public class String 
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int 
char 
String 
boolean 
boolean 
boolean 
int 


int 


String 
int 
String 
String[] 


boolean 


public class 


void 
void 
void 
void 


注 : 对 于 System.out/Stdout,，, 方法 是 静态 的 


String(String s) 
length() 

charAt(int i) 
substring(int i1i, int j) 
contains(String sub) 
startsWith(CString pre) 
endsWith(String post) 
indexOf(String p) 
indexOf(String p, int 1) 


concat(String t) 
compareTo(String t) 
replaceAll(String a, String b) 
split(String delim) 
equals(String t) 


System.out/StdOut/Out 
Out(String name) 
print(String s) 
println(CString s) 
print1nO) 


printf(CString format, ... ) 


创建 一 个 与 s 值 相同 的 字符 串 
字符 的 个 数 
索引 下 标 为 的 字符 
索引 下 标 从 i 鲁 上 =] 之 间 的 字符 串 
此 字符 串 是 否 包含 
此 字符 串 是 否 以 pre 开 头 ? 
此 字符 串 是 否 以 post 结 尾 ? 
第 一 次 出 现 p 的 位 置 索 引 
在 索引 位 置 之 后 第 一 次 出 现 的 
pattern 的 索引 下 标 
此 字符 串 后 添加 t 
字符 串 比 较 
此 字符 串 中 的 a 用 b 来 替换 
字符 串 被 delim 分 割 后 的 子 字 符 串 组 
此 字符 串 的 值 是 否 与 的 值 相同 


sub string? 


从 name 创 建 输出 流 

打印 s 

打印 s 并 另 起 一 行 

打印 新 行 

根据 格式 规范 将 参数 打印 到 标准 输出 


， 且 构造 函数 未 使 用 。 
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public class StdIn/In 


In(String name) 


从 标准 输入 读 取 单 个 数据 的 方法 


boolean 
int 
double 
boolean 
String 


isEmpty() 
readInt() 
readDouble() 
readBoolean() 
readString() 


从 标准 输入 读 取 字 符 的 方法 


boolean hasNextCharQO 


char 


readChar() 


从 标准 输入 读 取 行 的 方法 


boolean 
String 


hasNextLine() 
readLineO) 


读 取 其 余 标 准 输入 的 方法 


int[] 
double[] 
boolean[] 
String[] 
String[] 
String 


readAllInts() 
readA11DoublesO) 
readAllBooleans() 
readAllStrings() 
readA11Lines() 
readA110) 


从 name 创 建 输入 流 


标准 输入 是 否 为 空 (或 仅 有 空白 字符 ) ? 

读 取 一 个 数据 ， 将 其 转换 为 int 类 型 ， 然 后 返回 

读 取 一 个 数据 ， 将 其 转换 为 double 类 型 然后 返回 
读 取 一 个 数据 ， 将 其 转换 为 boolean 类 型 ， 然 后 返回 
读 取 数 据 并 将 其 作为 字符 串 返 回 


标准 输入 中 是 否 还 有 字符 尚未 读 取 ? 
从 标准 输入 读 取 一 个 字符 并 返回 


标准 输入 中 是 否 有 下 一 行 尚 未 读 取 ? 
读 取 行 的 其 余部 分 并 将 其 作为 字符 串 返 回 


读 取 所 有 剩余 的 数据 并 将 其 作为 int 数 组 返回 

读 取 所 有 剩余 的 数据 并 将 其 作为 double 数 组 返回 
读 取 所 有 剩余 的 数据 并 将 其 作为 boolean 数 组 返回 
读 取 所 有 剩余 的 数据 并 将 其 作为 Sting 数 组 返回 
读 取 所 有 剩余 的 行 并 将 其 作为 String 数 组 返回 

读 取 其 余 的 输入 并 将 它 作 为 一 个 字符 串 返 回 


注 1: 对 于 StdIn， 方法 是 静态 的 ， 且 构造 函数 未 使 用 。 


注 2: 数据 是 非 空白 字符 的 最 大 序列 。 


注 3: 在 读 取 数据 之 前 ， 任 何 前 导 空 格 都 将 被 丢弃 。 

注 4: 有 类 似 的 方法 来 读 取 byte 、short、long 和 float 类 型 的 值 。 

注 5: 读 取 输入 的 每 个 方法 如 果 无 法 读 取 下 一 个 值 ， 将 抛 出 运行 时 异常 ， 
可 能 因为 没有 更 多 的 输入 或 因为 输入 与 预期 类 型 不 匹配 。 


public class StdDraw 


void 
void 
void 
void 
void 
void 
void 
void 
void 
void 


void 


控制 命令 
void 
void 
void 
void 
void 
void 
void 


void 
void 


void 
void 


void 


Draw() 创建 一 个 新 的 Draw 对 象 


line(double x0, double y0, double x1L1，double y1) 
point(double x, double y) 

circle(double x, double y, double radius) 
filledCircle(double x, double y, double radius) 
square(double x, double y, double radius) 
filledSquare(double x, double y, double radius) 
rectangle(double x, double y, double rl, double r2) 
filledRectangle(double x, double y, double r1，double r2) 
polygon(double[] x, double[] y) 
filledPolygon(double[] x, double[] y) 

text(double x, double y, String s) 


setXscale(double x0，double x1) 将 x 坐标 重 置 汶 (x0, xl ) 
setYscale(double y0，double y1) 将 y 从 标 重 置 为 (y0, yl ) 


setPenRadius(double radius) 将 笔 半 径 设 置 为 fadius 
setPenColor(Color color) 设置 笔 的 颜色 为 color 
setFont(Font font) 设置 文本 字体 为 font 
setCanvasSize(int w, int h) 将 画布 大 小 设置 为 宽 w， 高 h 
enableDoubleBuffering() 启用 双 绥 冲 
disableDoubleBuffering() 关闭 双 绥 冲 

show() 将 缓冲 区 画布 复制 到 屏幕 画布 
clear(Color color) 清空 画布 并 将 画布 颜色 设置 为 color 
pause(int dt) 暂停 dt 毫秒 

save(String filename) 保存 为 jpg 文件 或 ,png 文件 


注 1: 对 于 StdDraw， 方 法 是 静态 的 ， 且 构造 函数 未 使 用 。 
注 2: 具有 相同 名 称 但 无 参数 的 方法 重 置 为 默认 值 。 
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public class StdAudio 





void play(String filename) 播放 给 定 的 .wav 文 件 
void play(double[] a) 播放 给 定 的 声波 
void play(double x) 将 x 作为 采样 样本 播放 1 /44100 秒 
void save(String filename，double[] a) 保存 到 一 个 .wav 文 件 
double[] read(String filename) 从 一 个 :wav 文 件 读 取 


public class Stopwatch 


Stopwatch() 创建 一 个 新 的 秒表 对 象 并 运行 
double elapsedTime() 自 秒表 创建 以 来 所 经 过 的 时 间 ( 以 秒 为 单位 ) 


public class Picture 


Picture(String filename) 从 文件 创建 一 个 图 片 
Picture(int w, int h) 创建 一 个 wxh 的 空白 图 片 
int width() 返回 图 片 的 宽度 
int height() 返回 图 片 的 高 度 
Color get(int col, int row) 返回 像素 (col，row) 的 颜色 
void set(int co1，int row，Color c) 给 c 设 置 像素 (col;， row ) 的 颜色 
void show() 在 窗 日 上 展示 图 片 


void save(String filename) 将 图 片 保存 为 文件 
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public class StdRandom 


void setSeed(long seed) 设置 种 子 以 获得 可 重 现 的 结果 
int uniform(int n) 0 和 n--1 之 间 的 整数 
double uniform(double lo, double hi) lo 和 hi 之 间 的 浮 点 数 
boolean bernoulli(double p) true 的 概率 为 p，false 的 概率 为 1-p 
double gaussian() 高 斯 分 布 ， 均 值 0， 标 准 差 1 
double gaussian(double mu，double sigma) 高 斯 分 布 ， 均值 mu， 标准 差 sigma 
int discrete(double[] p) 以 p 自 的 概率 生成 i 
void shuffle(double[] a) 随机 混 排 数组 a[] 中 的 元 素 


public class StdArrayIO 


double[] readDouble1D() 读 取 一 维 浮 点 数 数组 
double[][] readDoub1e2D0) 读 取 二 维 浮 点 数 数组 
void print(double[] a) 输出 一 维 浮 点 数 数组 

void print(double[][] a) 输出 三 维 浮 点 数 数 组 


注 1: 以 1D 结 尾 的 函数 ， 其 格式 是 1 个 整数 n 后 跟 n 个 值 。 
注 2: 以 2D 结 尾 的 函数 ， 其 格式 是 2 个 整数 m 和 n， 后 面 跟着 m x n 个 值 ， 以 行 排 序 。 
注 3: API 中 还 包括 基于 int 和 boolean 的 相同 方法 。 


public class StdStats 


double max(double[] a) 最 大 值 

double min(double[] a) 最 小 值 

double meanCdouble[] a) 平均 值 

double var(double[] a) 样本 方差 

double stddev(double[] a) 样本 标准 差 

double median(double[] a) 中 位 数 
void plotPoints(double[] a) 在 (afi]) 处 绘制 点 
void plotLines(double[] a) 绘制 连接 点 (i,ali]) 的 线段 
void plotBars(double[] a) plot bars to points at (1, a[i]) 


注 : 也 包含 其 他 数值 类 型 的 重 载 实现 


694 API 


public class Stack<Item> implements Iterable<Item> 


StackO) 创建 一 个 空 栈 
boolean isEmpty() 栈 是 否 为 空 
int size() 栈 中 数据 项 项 数 


void push(Item item) 插入 一 个 数据 项 到 栈 中 


Item pop() 将 最 近 插 入 的 数据 项 删除 并 返回 


public class Queue<Item> implements Iterable<Item> 


QueueQ) 创建 一 个 空 队 列 
boolean isEmpty() 队列 是 空 的 吗 ? 
int size() 将 一 个 项 插入 队列 中 
void enqueue(Item item) 移 除 并 返回 队列 申 最 早 加 入 的 项 
Item dequeue() 队列 中 项 的 个 数 


public class SET<Key extends Comparable<Key>> implements Iterable<Key> 


SETO) 新 建 一 个 空 的 集合 
boolean isEmpty() 集合 是 否 为 空 ? 
int size() 集合 中 键 的 数量 
void add(Key key) 问 集合 中 添加 键 
void remove(Key key) 从 集合 中 删除 键 
boolean contains(Key key) 该 键 是 否 在 集合 中 ? 
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public class ST<Key extends Comparable<Key>, Value> 
STO) 创建 一 个 空 的 符号 表 
void put(Key key，Value val) 将 val 与 key 建 立 关联 
Value get(Key key) 获取 与 key 相 关联 的 值 
void remove(Key key) 删除 键 key 及 其 对 应 的 值 
boolean contains(Key key) 是 否 存 在 对 应 于 key 的 值 
int size() 键 值 对 的 数量 
Iterable<Key> keys() 按照 排 好 序 的 顺序 返回 符号 表 中 所 有 的 键 
Key min() 返回 最 小 的 键 
Key max() 返回 最 大 的 键 
int rank(Key key) 小 于 key 的 键 的 数量 
Key select(int k) 从 小 到 大 排序 的 第 k 个 键 
Key floor(Key key) 小 于 等 于 key 的 最 大 键 
Key ceiling(Key key) 大 于 等 于 key 的 最 小 刍 
public class Graph 
Graph() 创建 一 个 空 图 
Graph(In in，String delimiter) 从 输入 流 中 读 取 图 
void addEdge(String v, String w) 增加 vy-w 边 
int VO 顶点 数 
Tt ~EL) 边 数 
Iterable<String> vertices() 图 中 的 顶点 
Iterable<String> adjacentTo(String v) vy 的 邻接 顶点 
int degree(String v) y 的 邻接 顶点 的 数量 
boolean hasVertex(String v) y 是 图 中 的 项 点 吗 ? 
boolean hasEdge(String v, String w) v-w 是 图 中 的 边 吗 ? 
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通过 跨 学 科 方式 对 计算 机 科学 进行 了 生动 有 趣 的 介绍 ， 非 常 适合 作为 学 生 和 对 计算 机 感 兴趣 的 读者 的 入 
门 教材 。 读 者 只 需 具备 科学 和 数学 的 基础 知识 ， 便 可 通过 本 书 开 启 计算 机 科学 之 旅 ! 


本 书 特 点 


。 本 书 以 解决 实际 问题 为 宗旨 ， 关 注 如 何 通 过 计算 机 和 编程 来 解决 数学 、 科 学 、 工 程 等 领域 的 实际 
问题 。 同 时 ， 帮 助 读者 揭 开 计算 的 神秘 面纱 ， 建 立 对 计算 机 科学 领域 的 系统 认 知 。 

本 书 第 一 部 分 基于 Java 语 言 ， 围 绕 编程 的 三 个 阶段 组 织 内 容 ， 使 读者 了 解 编程 的 基本 元 素 、 函 数 
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高 级 主题 。 此 外 ， 本 书 还 强调 了 计算 机 发 展 的 历史 知识 和 计算 思想 的 发 展 与 应 用 。 

。 本 书 的 另 一 独特 之 处 是 通过 构建 一 台 “ 玩 具 型 ”计算 机 ， 分 析 程 序 的 执行 过 程 ， 将 计算 机 
底层 的 工作 原理 和 设计 方法 巧妙 融合 ，. 更 有 效 地 培养 污 者 对 计算 机 系统 的 理解 与 认识 。 
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